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出版说明 




由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法. 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是: 《线性回归分析基 
础》、《高级回归 分析》 、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方怯 五种》 和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对^^书的内容和翻译都提出了很多中肯的建议.我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 



往事如烟，光阴 如梭。 转眼间，出国已然十年有余 s 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问題《以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竞是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面, 
国内 (十 年前）的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计\除此 
以外,还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修2001年完 
成博士学业之后，我又受安德鲁_梅隆基金会资助，在世界 
定最社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 

法项目的一些讨论会,受益良多 。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课(事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课)。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后,我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的文章;另一方面，也能在自己的研究中运用这些成熟的 
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方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” (Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 

型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型 、纵 贯数据的分析模型，包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生 ，一 直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易慷 6 中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以獪 
中文读者时，我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事，不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，碩士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李俊秀;香港大学教育学院博士研究生洪岩璧;北京大学 
社会学系博士研究生李丁、赵亮员 f 中国人民大学人口学系 
讲师巫锡炜;中国台湾“中央”研究院社会学所助理研究员林 
宗弘 f 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜念涛;美国加州大学 
洛杉矶分校社会学系博士研究生宋_。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异,校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
嫌、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外, 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 




我也致以诚挚的谢意。有些作者 ，如香 港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 

吴晓刚 

于香港九龙清水湾 



面板数据(或译“跟踪调查数据”)是指在不同时点对相 
同样本个体进行重复观察所得的 数据。 舆情调査就是一个 
典型的例子，在这种调査中，被抽中的个体将被调査访问两 
次(比如，年份1和年份 2), 每一次都询问相同的问题，与常 
规的截面设计相比，跟踪调査设计有很多值得称赞的地方， 
特别是它允许更强的因果推论，因为它将因果过程的时间维 
度明确考虑在内。来看一个假设的例子，假定政治学教授 


Alice Green 研究了某次法国选民调査（在时间 t 上进行的) 
中的左 一右派 意识形态认同 ( D 与投票意向( V )之间的关系。 
通过使用这一截面数据，她将对1,做回归(再加上控制变 
量，统一用爲表示)后，发现意识形态认同与投票意向高度 


相关: 


Vi = a + bl t +cZ g -\-€ l [1] 

不过, Green 教授怀疑这种关系在理论上是错误的，至少 
部分是虚假的。她认为，首先，可能因为“习惯的力量”，上一 
次投票意向％4会影响当前的投票意向 Fm 另外，以往的意 
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识形态认同会影响当下的意识形态认同 i , a 并且，她认 
为意识形态认同 A 本身就受到投票意向 v , 的影响。总之, 
她认为模式 如下： 

V t =a^bV t ^+d t ^rdZ t + e t [ 2 ] 

J , - a + 67 ( _, + cV t + cZ t + w , [3] 

方程 2 和方程 3 所刻画的模型与方程 1 截然不同。可 
惜， Green 教授凭借一个时点《的截面样本是无法估计出第 
二个模型的。不过，如果该调査是某个已经在时间 t _ l 上 
完成了第一轮调査的跟踪调査的第二轮，那她应该能估计出 
第二个模型(假定她还采取了必要的步骤以确保模型可识 
别）。这就是面板研究设计所承诺的理论功效及统计力量。 

在本书中， Finkel 博士阐明了面板数据带来的因果推论 
机会，以及如何克服各种分析障碍的方法。对于后者，他举 
例指出了对像方程2和方程3这样的模型进行一般最小二 
乘回归估计的不足。由于互为因果问题，两阶段最小二乘法 
或 LISREL 程序成为必要，对这两种方法, Finkel 在书中都进 
行了认真的介绍。另外，与自相关有关的某些假定必须满 
足,以使模型得到识别。除了这些问題外，测量误差对面板 
数据的影响尤为严重 # 正如 Finkel 所证明的,当这一因素被 
考虑时，(模 型的) 结论可能大不相同。为了演示如何处理测 
量误差，他从简单的单指标 、二 期模型一直讲到更复杂的模 
型，如三指标、三期模型 

此外还有一点也很重要，本书让读者明白，只有满足了 
一 些假定，才能进行有意义的参数估计 9 另外，为了方便研 
究实践，书中提供了大量的真实数据应用案例。其中，有两 



个数据集用得恰到好处，一个是1987年至1989年前联邦德 
国抗议行为的跟踪调査，另一个是1980年美国大选跟踪调 
査。总之，在假定读者已掌握回归分析及 LISREL 用法基础 
上， Finkel 博士为我们提供了清晰易读而又十分先进的面板 
分析技术。 


迈克尔_ S •刘易斯-贝克 
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用圈 板敷_ 因 羅 分霍 


面板数据在社会科学中通常被用来对个体变化及社会 
变迁理论进行检验,这种数据由来自相同个体或单位在儿个 
时点上的信息构成。和静止的截面分析相比，面板分析最重 
要的特征在于，它将变化本身明确地包含在设计中，从而使 
个体(或其他层次的单位)在一系列变量上的变化得到直接 
测量。面板数据应该和另外两种形式的纵贯数据区别开 
( Menard , 1991) :“重复截面”或“趋势”数据，这种数据由在 
不同的时点上向多个不同单位收集的相同变量信息组成;另 
外一种是‘‘时间序列”数据，这种数据所含的观察结果来自同 
—个个体在不同时点上的多个变量 （ Ostrem ， 1978)。面板 
数据的不同之处在于,它包含了多个观察单位在相同变量上 
的多次重复测量数据。 [1] 

本书对适用于面板数据分析的各种模型进行了概览，特 
别关注了跟踪调査优于截面研究设计的主要领域:变量间因 
果关系的分析。众所周知，变量 X 与 y 之间若要存在因果关 
系,则必须满足如下条件 ( Menard ， 1991 ; 17) : < 1 ) X 和 Y 必 

须共变，在非实验研究中表现为两变量间的相关系数不为0; 
(2) 从时间上看， X 必须在 Y 之前； （3) 这种相关不是“虚假” 
的,或者说，并不是由 X 和 Y 与第三个变量或其他一系列变 
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量的相关造成的。成功的因果推论还必须基于对所关注变蛩 
的准 确测童 ，当观察变量的随机或非随机测量误差未被考虑 
和处理时，因果作用的统计估计就可能是不正确的 （Berry 
Feldman, 1985； Carmines Zeller, 1979)。 截面数据尽管能 

提供第一个相关条件上的证据，但在提供时间先后关系、相 
关非虚假性的证据以及在设置纠正测量误差模型方面十分 
局限。我们后面将清楚地看到，面板数据在这些方面具有绝 
对优势。 

在截面分析中，对变量的单时点测量使时间先后顺序的 
判断非常困难，从而无法 排除： X和 Y 之间的共变关系是由 
于 Y 导致X，或是通过相互因果关系造成的， 相反. 面板分 
析中对相同单位的X和 Y 的历时测量，使研究者设置某种必 
定满足时间先后标准的模型 每个变量的早前取值会对 
其他变量后来的取值造成影响——成为可能。另外，一旦怀 
疑变量间存在相互因果关系，面板分析能在假定限制条件比 
在截面分析中少的情况下，估计出变量间带反馈效应的非递 
归模型。面板分析在控制可能使X和 Y 之间的关系部分或 
完全成为虚假关系的外部变量方面也非常有用。在截面分 
析中，只有通过在统计模型中实际纳入外部变量，才能对虚 
假关系进行检验，但在面板分析中.即便是由某些不可测量 
的因素造成的虚假也能被检验《最后•在面板数据中拟合测 
童误差模型比在截面数据中所必需的限制性假定少，分析者 
可利用新增的历时观察对变量的因果作用和测量属性进行 
估计 s 在上述所有方面，跟踪调查设计（面板设计）允许对因 
果关系进行比在截面数据下更严格的检验，所以说，它比其 
他观察研究设计更接近于在实验方法下才可能进行的、对于 
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因果关系的控制性检验。 

本书将讨论两种使用面板数据进行因果分析的互补性 
观点。书中将呈现面板数据强化因果推论过程的多种方式， 
接下来的章节将演示如何估计各种含有不同时滞设定、交互 
影响及测量不尽人意的变量的模型。与此同时，本书强调面 
板数据并不是非实验研究设计下解决因果推论问题的万灵 
丹。本书将表明，所有方法和模型都依赖于它们各自的一套 
需要在给定条件下被论证和合理化的假定。如果这些假定 
不堪一击或可能导致不合理的经验性结讼，研究者想要对分 
析得出的因果结论怀有信心，就必须对其他替代模型进行估 
计和比较。 

自从 Markus 的著作《面板数据分析 Panel 
Date ) 出版以来，有关丽板分析的文献迅猛增长。本书试图 
突出不同学科及不同分析传统的学者在面板数据分析上作 
出的贡献。但有些主题难以全部囊括，例如，本书仅集中关 
注分析定距因变量的线性模型，而 Mark US (1979 : 第 2 章)介 
绍了离散型面板数据的分析技术, Plewis (1985: 第 6— 7 章) 
对新近的研究做了概括。本书的讨论主要限于面板模型的 
估计和解释问题，暂不讨论与面板案例流失和死亡相关的问 
题以及与跟踪调查受访者的自我选择有关的偏差问题，关 
丁这些主题的出色讨论，读者可以参看 Kessler 和 Greenberg 
(1981: 第 12 章)以及 M en ard (1991 : 第 4 章）的作品。 

如果读者想从后面的展示中得到最大收益，就要对多元 
回 归和因果建模方法有所了解 （ Asher ， 1983; Berry ， 1984； 
Berry & Feldman , 1985)。同时建议读者对更一般的结构方 
程方法.如 LISREL 或 EQS 等有所了解 ，因为 这些程序现在 



已经是面板分析的常规工具了。有关 LISREL 的介绍，可以 
参考 Loag ( I 933 a , 1983 b ); 关于 LISREL 和其他方法更为具 
体的讨论，可以参看下列文献: Bolien ( 1989)、 Bentler ( 1985). 
Hayduk (1987 ) 、 Jdreskog 和 Sorborm (1976 ) 、 McArdle 和 
AbeK 1990) 以及 McDonald (1980) G 在本书有些章节，我们 
会用 LISREL 框架来展示和讨论一些模型，以方便应用这些 
方法，但这些模型同样可以用 EQS 或其他结构方程软件进 
行估计。书后的附录对 LISREL 符号系统做了概要介绍。 
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面板数据含有每个个体或单位的各个变量在 tAt - l 、 
t - z 等时点上的测量结果，时点多少取决于观察的轮数/期 
数。因此 * 我们有可能通过使用各个变量早前及当下的取值 
信息来建构和估计因果模型 a 滞后(延迟 ®) 因变量 Y 或“滞 
后内生”变量的存在允许我们直接分析 y 的历时变化，如果 
我们能够表明变量 x 与 Y 的变化 ( AY ) 有关，那么由此提供 
的 X 与 Y 之间存在因果关系的证据要比从静态的截面设计 
中可能获得的直接得多。此外，面板数据同时含有 X 的当下 
值和滞后值，使我们可以对 X 和^之间的因果作用进行各种 
不同的设置。除了 估计足 ^对必的影响外，研究者还可以 
创建一个变量，以代表 X 在不同调査轮次间的变化,然后将 
Y 或建模为 X ,、 AX 或这些变量的某种组合的 
函数。 

不过，尽管 X 和 Y 的当下值及早前值同时存在，为研究 
者分析(事物的)变化提供了重要的新信息，但在面板模型中 
设置这些变量作用的确切方法并非如此显而易见。在本章， 

① lagged , 翻译为 “ 慊后'“廷宕 延迟' 指早前发生_事情或变董对后来的 
亊情或变量具有延续性的 影响. 具有这种影响的变量被称为“赚后变置”或“延宕变 
量' —译者注 
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我们将看到，在大多数情况下，较好的面板分析模型只是通 
过因变量滞后值，及一系列自变量 X 来估计因变量当下 
值1的“稳定得分”或“条件性变化”方程的某种变体接 
着，我们将告诉大家是否选择足、和/或 AX 作为自变 
量，主要取决于各轮观察之间的间隔长度以及对 X 到 Y 的滞 
后性因果作用的性质及时间性的理论假定 a 最后，在后面几 
章里，我们会更具体地讨论估计 和解释 面板模型时的 几个潜 
在问题。 
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第1节 I 变化得分模型与滞后内生变 


量的角色 




“无条件的，，变化得分模型 

使用面板数据估计自变量 X 对因变量 Y 变化的影响的 
办法之一，从截面分析中常用模型的拓展 开始： 

Y t =^+^ X t +^ [2.1] 

其中 Y , 和 X ,为某个体或案例在时间 t 上的因变量及自变量 
取值， e , 为误差项。要在这一方程中纳入其他被观察的自变 
量并不会遇到新麻烦，这里给出只含两个变量的简单模型是 
为了讲解的方便。面板数据中，同一个变量会在一个以上的 
时点被测量，这些新增测量可以为模型参数的估计提供重要 
的信息。假定自变量在两次测量之间发生了一定程度的变 
化*且 x 与 y 之间的因果过程与在时间 f 一 1时的相同，也就 
是说知^ = | i f ，那么，从方程2_ 1中减去一个使用时点1 
的 X 、 Y 和 e 值表示的类似方程即可 得到： 

Y t —Y t - { = — ) +pi (X t — X t ^i ) + (t — e 卜 1 ) 

或者 [2-2] 


△Y = 雄 + 氏 AX + Ae 
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该方程表示 Y 的变化对X的变化的简单回归，被称为面 
板分析的“无条件的变化得分法”或“ 一阶差分法” (Allison， 
1990 1 Liker* Augustyniak Duncan* 1985). 

这一方程在几方面优于对应的截面方程 2. 1。首先，通 
过在分析中使用真实的变化得分，该方程直接对变量在个体 
或单位层面的变化的决定因素进行建模，不像在截面分析 
中，自变量的“变化”对因变量的“变化”的回归估计完全基于 
同一时点上不同单位间的变异。这一优势是所有面板模型 
都具备的^更确切地说，无条件的变化得分法控制了方程 
2.1 中某些被遗漏的解释变量或被计量经济学称为‘‘个体固定 
效应”的东西。如果真实的解释模型包括某些未知或因为某 
种原因无法被纳人模型的恒定自变量 (Z) ,如下列方程 所示： 

Y, = j3b + pi X £ 4- ^2 Z + e, [2.3] 

那么，对卩 i 的截面估计将会有偏，偏差程度与X和 Z 的相关 
程度一致(因为 Z 被整个归人了方程 2. 1的误差项父 

不过，如果假定这些被遗漏的 z 变量对 y 的影响保持不 
变，那么，经过差分过程,它们会从方程 2. 2中被完全 消除： 


AY = + Pi AX + pg h2> ~\~ Ac 

AY = Aji, + AX + Ae 


[ 2 . 4 ] 


由于方程 2. 4 中 Z 的混淆影响已被移除，自变量 AX 不再和 
误差项&相关，因为方程 2. 3中对应的X、及^被假定与 e, 
及不相关。因此，方程 2.4 能得到X对 Y 的因果作用的 
无偏估计，而方程 2. 1和方程 2. 4估计的择之差就代表了截 
面模型方程 2. 1由于遗漏相关恒定变量 Z 而导致的错误设 
定偏差的大小。正因为这种特性，“即便模型只被部分设定, 
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面板数据分析仍能对模型中自变量的影响迸行一致的估计” 
( Araiinger , 1987：339) fi 这无疑是面板模型相对截面模型的 

一 个明显优势。 

不过，尽管一阶差分模型或无条件的变化得分面板模型 
在估计此种错误设定的模型上很有用，但它含有一个极为严 
格的假定:滯后因变量（或“滞后的内生变量”)（-:对 t 和 
△ y 都没有影响。后面我们将看到，这一假定可能是不正确 
的，正因为如此，将无条件变化模型作为结构模型来分析变 
化通常是错误的 

稳定得分或条件变化模型 


将滞后因变量纳人方程 2. 1即得到所谓的稳定得分或 
条件变化面板模型 ( Plewis ， 1985)，如下 所示： 


Y t = + pz Yh + & 


[2.5] 


在这一模型中， l 由其早前值、同期自变量 X 及一个被 
假定方差恒定、不存在自相关、不与 X 或相关的误差项 
来解释。当 x 不恒定且在多个时点得到测量时 ，足- j 甚至 x 
的其他滞后值的影响同样可被纳人模型，这会在后面再进行 
讨论。 

这一模型同样可以用 AY —因变量的历时变化——来 
表达，只要从方程 2. 5 中减去 Yh 就可 得到： 


△Y =氏 + 氏兄 + (块 — l ) y ( _, [2.6] 

从这一设定可以看到，在稳定得分模型中， X 对 Y 的因果作 
用 p ! 可被解释为控制因变量初始值后， X 对的因果作 
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用，而方程 2.6 中兄^对故的影响就是方程 2.5 中对 
Y , 的稳定效应减去 U 

前面讨论的无条件变化模型也可以 用兄和 进行表 
达，通过将 Ym 移到方程 2. 4的右边并限定其因果作用等于 
1即可： 

F ( = APo+PiAX + y^+Ae [2. 7] 

有时，无条件变化模型被认为只是稳定得分公式的一种被限 
定形式 (Hendrickson &• Jones ，1987) „这是不正确的，因为 

兄-,必然与方程 2. 7中的误差项 ( e ,- e ,-,) 相关，但^^被 
假定与方程 2. 5中的误差项 e < 无关 ( Allison , 1990:103), 这 
意味着两个模型在设定上存在根本差别，对分析者来说，或 
估计方程 2. 4的无条件变化模型，或估计方程2, 5或方程 2. 6 
的稳定得分 模型。 在非实验研究中有不少理由支持我们选 
择稳定得分模型。 

稳定得分模型的实际合理性 

首先，有大量的理由可以假定是兄或 AT 的原因之 
一。 在政治、社会或心理的态度分析中，早前倾向会对倾向 
的当前状态或其历时变化产生一定的因果作用。例如，对现 
任总统某个月的表现表示赞赏的人，至少会部分因为他们此 
前的态度而更有可能对总统下个月的表现表示支持。另一 
个例子是，一个人以往的收入不仅是当前收入的良好预测变 
量，并且确实对当前收入具有因果作用，因为有钱人采取的 
投资策略带来的收人增长比穷人所做的经济决定带来的增 
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长大得多 ( Plewis , 1985:59〉。在官僚主义决策制定模型中， 
通常假定一个机构以往各年的预算或支出会对当年的开支 
额度产生一定的因果影响。一般而言，只要因变量的当前状 
态(或因变量的变化)直接由以往状态所决定，那么在这种情 
况下，要想正确设定模型，就必须纳人滞后因变量。相反，如 
果变量在每个时期都必须“重生”，那么将早前值纳入模型作 
为当前状态的预测因素也就没有什么实质基础了。 [3] 

向均值回归 

即便没有明确的实际理由支持滞后 Y 变量的纳人，稳定 
得分模型从统计上来讲也具有合理性。其原因在于，遗漏滞 
后 y 变量将无法顾及变化分析中最常见的现象 之一: 变量初 
始值与其后续变动之间极可能存在的负相关或者通常所说 
的“向均值回归”。由于某个时点， Y 取值较大的个体或单位 
在后续时点的取值将偏小，而取值较小的个体，后续取值将 
偏大。对于这一倾向的忽略，将使无条件变化得分模型估计 
结果有偏，偏差程度与解释变量叉(或 AX ) 和 y 的初始值的 
相关程度一致。 

“回归效应”导致面板数据中兄-:与故负相关的原因很 
多。 Y 的随机测量误差是其中之一。因为取值较大的 
原因可能是测量误盖较大，而这种误差在下一轮调查时将趋 
于变小。在极端情况下，: T 事实上”根本没有变化，全部的观 
察变化都是由测量误差造成的，而且可以看到，只要测量误 
差方差一直保持不变，与之间的协方差就会等于 Y 
的误差方差的相反数 ( Dwyer , 1983:339)。另外，“向均值回 
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归”在测量完美的情况下也能存在。因为取值极端，部 
分是由于较大的误差项(代表所有被遗漏变量及纯随机 
因素的影响)造成的，而误差项在下一轮调査中趋向变小，所 
以 Y 的变化很可能与兄-:负相关。如果情况真是这样，那么 
忽略 Ym 会导致对所有同时与兄及^-，正相关的自变量 X 
对 AY 的影响的低估。 

回归效应在面板数据中并非总是出现，但已经证明一旦 
下述条件得到满足，一个变量的初始值与其后续变化之间的 
负相关就会出现: （ 1 ) 该变量各个时期的取值并非完美相关; 
(2) 其方差相对固定 （ Bohrmstedt ， 1969; Kessler Green ¬ 
berg , 1981； Nesselroade，Stigler Baltes ，1980)* 在此类 

情况下，将^-，纳人回归模型是控制此种现象的方式之一， 
并可对分析作出如下解 释:在 的固定水平上，也就是说, 
在考虑了 Y 的初始值与后续变化之间的负影响后，自变量 X 
是否会影响 y 的变化？不过，在第4章中我们将看到，如果 
回归效应是因兄-^的测量误差造成的,那么模型还需要进一 
步修正。 

负反馈作用 

在面板模型中纳人滞后 y 变量的另一个理由来自社会 
系统的稳定性概念。如果一个因果系统会在未来某个时期 
达到一个固定平衡点使每个案例的 y 取值保持不变，除非系 

统本身被某种外部干扰因素所改变，那么它就被认为是“稳 
定的” ( Arminger , 1987} Dwyer , 1983)。虽然经验研究所分 

析的绝大多数系统尚未达到平衡，但可以证明系统的稳定性 
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要求兄^对必存在“负反馈”效应 ( Coleman ， 1968)。试想, 
如果”^对 ay 的影响是正向的，那么 y 将无限扩张:假如 
为负值，那么随着时间的变化， y 将越来 越负; 如果 Y ；-, 
为正数，那么 Y 会越来 越正。 无论何种情况， Y 的方差都会 
不断“爆炸”，这在绝大多数社会一心理系统中，都被认为是 
不可能发生的(尽管在技术上并非不可能: U 因此，兄- 
的负向影响会引导系统趋向 平衡: 当 Y 超出平衡水平时，它 
就会降低;当 Y 低于它的平衡水平时，它就会提高。 


对 ay 的此种负反馈也被解释为某些通过模型而被 
遗漏的、将 Yh 与 I 连接起来的因果路径的代理 变量。 
Coleman (1968) 声称，^^^对 I 的积极影响（即义-:对 AY 的 

负效应)可以被看做： 


经验系统中尚不为正式（因果）系统所知道的所有 
反馈链条的代理者。当正式系统更加完善时，这一系数 
应该趋近于 L 因此》该系数的大小可以用来评估对经 
验系统作出表征的完善程度。 （1968:441) 

从这个角度来看，将因变量的早前水平纳入模型， 
至少可以部分控制影响 K 变化的被遗漏的变量。不 
过，作为这种角色，滞后的 Y 具有一种不同的“认识谂地 
位”，雨非一个实际意义上对兄构成直接因果作用的变 
量，其估计效应的解释也因此需要相应调整。 （ Arm - 
inger , 1987 1 Liker et aL ， 1985) 


部分调整 


滞后 Y 值被纳人某些面板模型，是为了估计一些其他理 
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论上相关的参数。例子之一是最先在经济学中流行起来的 
部分调整 模型。 在这种模型中，需要用自变童进行解释的是 
某种未知的、“可欲的”、“最优的”或“目标”值 07) 而非因变 
量的实际值(兄），因此，其实际方 程为： 

y* = po + pi X, + [2. 8] 

y ： 常常被看做前面已经描述过的 r 的均衡水平，但渴望值 
还可代表其他目标,如一个组织的目标。用理性行动的术 
语来说，就是能够给个体带来最大效用的 Y 值 （Turrn & 
Hannan , 1984:339)。 

根据这一模型，个体或组织一直力求使 Y 与 F 之间的 
差异最小化，但 y 的实际变化只等于 yr 与兄-^差异的一部 
分 a 。 也就是说，由于惯性、无知或者阻止变迁的结构性因素 
等影响，每个时期只能“部分地调整” Y 的渴望值与实际值之 
间的差距。这一想法可以表述 如下： 

^ctar-y^) [2.9] 

其中，系数 a 表示调整系数，或者说是从 r _ 1到《期间，渴望 
值与实际值之间的差距被缩小的程度。将方程 2. 8中的 >7 
值代人方程 2. 9 ， 即得到估计方程： 

Y t —Y t -\ = ~ 十 aji X t 十贱 [2. 10] 


这一方程与条件变化模型方程 2. 6有着同样的一般形 
式——以 IV :及足来解释从方程 2 . 10中可以看到， 
对 AY 的回归作用等于调整参数《的相反数，估计的作 
用越接近于一 1，在给定时间内，调整的 Y 越接近其“渴望”值 
或平衡值。从估计方程2_ 10中得到的 X ,的回归作用有两 
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种解释方式:从初始形式来看，它代表调查轮次间及对 Y 或 
AF 的短期作用;将这一取值除以 a 即得到方程 2. 8中的私 f 

后者代表足对平衡值或渴望值 17 的长期作用。因此，部分 
调整模型提供了一种不同但具有互补性的理由，以支持在面 
板模型中纳人作为 Ay 的解释变量。 [4] 
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第2节 | ft 定得分機型的估计 

inffnn wwi 囑躍， .. .鄙洲 inim u 罐 m wm_niLmiiiwL u.i j i _i i 山 m 


我们将用来自 1987 年至 1989 年前联邦德国跟踪调査 
的数据示范说明稳定得分模型。当初进行这一调査是为了 
模拟和解释政治抗议活动中的个体参与(关于这一研究及 
其抽样过程的更多细节，请参阅 Finkel , Muller & Opp , 
1989)。这里，我们感兴趣的两个变量在两轮调査中都得到 
薄量，一个是个体合法抗议潜能指标 ( PROTEST , 及 PROS " 
TEST 2 ) 的对数得分，这一指标是用个体过去八种非暴力行 
为的参与情况对某些未来行为意向组合进行加权测量得到 
的，这些非暴力行为包括为请愿书收集签名和参加合法游 
片示威等；另一个是群体成员资格指标 （ GROUPS 及 
GROUPS ), 这一变量代表受访者从属的、他们自己认为会 
鼓励抗议行为的群体组织的数量。时间时的抗议潜能 
可能通过一个部分调整过程与时间 f 时的抗议潜能连接起 
来，在此,代表使个体效用最大化的抗议水平，而群体成 
员资格变量 ( GROUPS ^) 则代表社会压力或群体动员过程的 
一 个部分，正是通过这一过程，个体从参与中得到效用6由 
于这一原因，同样也因为上面已经描述过的统计原因，我们 
设定了稳定得分模型以代表 X 和 Y 之间的历时关系。在这 
一章中，我们假定 GROUPS 和 PROTEST 之间的因果关系 


用面 whib 畢分析 


是单向的。 

如果稳定得分模型中的误差项被假定与足和，都不 
相关，那么模型系数通过一般最小二乘 ( OLS ) 回归就可得到 
一致的估计。在这种假定下， OLS 通常产生的估计不仅一 
致(即在 N 趋近无穷大的过程中，估计结果将趋近于总体真 
值)且无偏(即来自随机样本的无穷多个估计，既不会高估 
也不会低估真实参数），但是，当滞后因变董被纳入递归模 
型时， OLS 估计将含有一个随着 N 变大而趋近于0的偏差 
( Johnston , 1972)。因此，存在滞后因变量的 OLS 估计仍具 
有一致性，但从技术上来讲并非无偏。本例来自 OLS 估计 
的结果如下： 

PROTEST 2 = 0. 22 + 0. 10 GROUPS ^ + 0. 40 PROTEST , 

[ 2 . 11 ] 

(0. 02) (0. 02) (0.04) 

0.30 0.40 

括号中的数字为标准误，标准化系数为带下划线的数字，模 
型的确定系数为0.34。这一结果表明，控制因变量的原 
初水平后，每多一个个体在1989年参加群体组织，将使1989 
年抗议潜能的对数增加 0. 10,且该作用在常规水平上统计显 
著^这一模型也可以这样解释:在控制原初抗议水平的情况 
下，1989年的群体资格每增加一个，将导致抗议潜能在1987 
年到1989年间变化 0.10 o 1987年的抗议潜能对1989年的 
抗议潜能的稳定作用是 0. 40,这一效应同样在统计上显著。 
与之等价的解释是，1987年的抗议潜能对两轮调查间抗议水 
平的变化的作用是 (0.40 —1) 或一0.60。从部分调整的观点 
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来看， a 等于 0. 60，这意味着从一个时期到下一个时期，抗议 
水平被其最优(平衡)水平调整了 60%。从长期因果作用来 
看，群体成员资格指标每增加一个单位，对抗议潜能的最优 
或平衡水平的影响为 a 17(0, 10除以 0. 60,即根据方程 
% 10,将估计的 p ! 除以 a )。 
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用面板数据做因果分析 


第3节 | 其他滞后设定 


刚才估计的模型规定自变量 GROUPS 对同一时点的 
PROTEST 具有影响，也就是说，X ,被假定导致事实上， 
我们不能说 x “即刻”造成了 y， 而只能说，相对于两轮测量之 
间的时间间隔， x 影响 y 的因果时滞很短^ 5 =但这种“同步” 
或“同时”效应设定只是多种可供试探的设定之一，通过跟踪 
调查数据对这些设定进行试探，用以确定 x 对 y 的因果作 
用。如果 x 对 y 构成影响的时滞间隔充分长，但仍短于两轮 
调査之间的间隔，那么滞后作用模型可能更合适，在这种模 
型中，I 是的函数 9 如果 x —直保持高度稳定， 
不同的设定选择并不会带来太大差异，因为这与从兄_ 5 或 
足对兄进行因果作用估计得到的结果相似。但如果 x 在 
不同调查轮次之间发生显著变化，那么由因果时滞设置不当 
所可能造成的偏差将相当大。 

为变量之间的作用设定合适的时滞结构是面板分析(及 
其他纵贯分析 ) 中最难的问题之一，之所以如此，原因大致有 
二:第一，研究者通常不确定在理论上，X需要花多长时间才 
能对 Y 造成影响。如果一个人参加了某种具有抗议取向的 
群体或次级组织，到底需要经过一天、一个星期、三个月，还 
是六个月，其抗议倾向才能被强化呢？第二•即使知道理论 
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上的因果时滞，也无法保证这一间隔与观察轮次之间的间隔 
一致，因为管理的方便性、资金的可获得性之类的因素和实 
际关心的因素一样，决定着追踪调査的测量间隔。由于这种 
不确定性，面板分析中•时滞结构的设定首先应该在理论指 
导下进行，其次才以特定研究情境下的经验证据为依据。 

离散时间面板模型 

X 和 Y 之间的因果滞后关系的重要方面之一是，变化究 
竟是“跳跃式”地离散发生，还是持续不断地进行。例如，议会 
选举结果，每隔一个固定的两年就变化一次，而对总统的评价 
在为期四年的任期内几乎是连续变化的。连续时间过程的面 
板模型由 Coleman (1968) 发展而来，最近又得到了 Tuma 和 
Hannan (1984) 的发展，我们将在下一节对这些方法进行更详 
细的描述，如果对象的变化被假定是离散地发生的，那么时 
滞结构的设置首先应该基于一种事先预期—— X 究竟需要花 
多长时间才能对 Y 产生影响？同时要结合考虑跟踪调查各轮 
测 M 之间的 间隔。 如果缺乏明确的理论指导对模型时滞长度进 
行恰当的设定，分析者可以尝试以经验的方式决定因果时滞 a 

例如.在后面的章节中，我们将就非法伙伴群体涉入情 
况对青少年自身越轨行为的影响进行分析。在这个例子中， 
X 和 Y 之间的因果时滞应该相对较短，希望一个青少年二至 
三年前的伙伴群体影响其现在的行为可能是不合理的，因 
此，如果每隔三年才收集一次面板数据,“滞后作用”模型就 
不是合适的设定•而“同步”效应模型能更好地描述违法伙伴 
对青少年违法犯罪的因果 作用- 不过，如果隔1或2个月就 
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收集一次数据•那么滞后作用设定会更合适，因为这一间隔 
与伙伴群体中的社会压力、计划等因素促成违法行为实际所 
需的时间更对应。 

在理论上，我们可能要求一个模型同时具有滞后作用和 
同步作用，请试想，压抑或痛苦的人生经历对个体当前的心 
理健康造成的影响。若跟踪调查周期只有一年或两年，那么 
有理由认为当前痛苦的生命事件会对同期的心理健康造成 
影响。同时，两年以前的生命事件 （ X - t ) 也会对当前的心理 
健康具有挥之不去的直接影响，或通过一些不可测量的变 

量，如个体的身体状态、工作业绩之类的因素，对当前健康形 
成间接影响 （Kessler & Greenberg , 1981:78—79)。 

在单向因果模型中，同时纳人和； Cm 不会带来估计 
上的严重问题(除变量非常稳定时可能出现的高度共线性问 
题外）.因此，如下形式的模型可被估计，从而为寻找恰当的 
滞后因果关系提供一些 线索： 

y f -po + p 1 x ( 4 - + + [2. 12] 


这一方程在直观上更好地代表了自变量的变化与因变量的 
变化之间的关系。通过使用等式 X = + AX , 这一方程 

的系数可用 X 的变化重新表述。方程 2 . 12可以表 达为： 

~ po H - J3z^_i H - (j3i H~ J33)X ( —i J3i AX e t [2.13] 

请注意.方程 2. 13 中 AX 对 y , 的效应％与方程 2. 12 中 X , 
对 I 的效应相同。换言之， X 的变化对兄有影响即意味着， 
在控制了 X 和 Y 的初始值后， x 对有影响 （Kessler & 
Greenberg f 1981: 10) 0 

方程 2. 13的参数可以通过这些代数运算得到，也可通 
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过将 I 和 AX 作为解释变量纳入回归模型而直接得到（这 
还能得到对应的标准误）。类似的运算同样可以用来将方程 
2. 12变为 AX 和； C 2 的表达式。 [(5] 这些模型在代数上是等价 
的，因此.结果的实质性解释取决于模型的理论假定。如在 
政治稳定模型中，不稳定程度很可能被假定与一个国家当前 
的经济水平(不）负相关，但正如快速经济增长是“失稳力量” 
这一假设所示，它也可能受到一段时间内经济水平变化 
( AX ) 的正向影响。而在政治竞选对投票者的影响模型中， 
可能假定个体投票行为同时取决于某些初始特征（例如，对 
现任管理者的表现的认同程度足）和选举期间的突发事件 
造成的认同程度的变化 ( AXKFinkel , 1993). 因此，将 X 的 

当前值与滞后值作为 Y 的变化的预测变量纳人其中的方程 
可以有多种解释方式，具体取决于模型的实际关怀9 

我们对群体资格一抗议行为例子中的稳定得分模型进行 
了再次估计，将1987年的群体资格变量 GROUPS , 纳入，作为 
1989年的抗议倾向的解释变量。从理论上讲，如果群体发动 
的抗议行为在事前相当长的时间内就已计划展开，那么群体 
成员资格对抗议行为的影响就会存在一定程度的滞后。但 
是为期两年的观察间隔相对于滞后间隔可能又太长了，因而 
同步作用模型可能更好。 OLS 估计结果支持这一观点。用 
及-,和解释 K 的纯滞后作用模型表明， GROUPS 对 
PROTEST 的作用比方程 2. 13代表的同步模型小得多： 

PROTEST = 0. 22 + 0. 04 GROUPS 】 + 0. 47 PROTEST , 

[2.14] 

(0*02) (0*02) (0, 05) 

0, 47 


0 . 11 
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括号中是标准误，标准化系数为带有下划线的数字 ，记为 
0.28, 比同步模型中的小。估计一个同时含有 GROUPS 和 
GROUPS 作为自变量的稳定得分模型，结果如 
PROTEST = 

0. 22+0.11 GROUPS + (-0.01) GROUPS , +0. 40 PROTEST 

[ 2 . 15 ] 

(0.02) (0.02) (—0,02) (0.04) 

0.33 -0.02 0.40 


括号中为标准误，标准化系数为带有下划线的数字， F 为 
0. 34。这一结果表明，在控制了 Y 变量及群体资格两者的滞 
后影响后，当前的群体成员资格与抗议倾向显著相关。控制 
当前群体成员资格变童后，滞后群体成员资格变量在统计上 
不显著，并且对模型解释力的贡献不大。根据方程 2. 13. 
GROUPS , 的影响同样可以解释为，在控制滞后的群体成员 
资格变童及滞后的抗议倾向 变憧后 .群体成员资格数的变化 
对 PROTEST 的影响. 


连续时间面板模型 

上一节讨论了在既定的(调查)时间间隔下.估计 X 的作 
用落实到 y 上的恰当时滞结构的方法。如果理论时滞长度 
与观察轮次间的时长对应，滞后作用模型就较 合适； 如果时 
滞长度比各轮调杳间的间隔短得多.那么同步作用模型会更 
好。不过，在有些面板模型中， x 对 y 的影响几乎町以看做 
是连续地发生的.而不是在各轮观察之间离散地跳跃发生。 
例如，个体的党派身份对他们对总统候选人的态度的影响在 
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整个竞选过程中持续存在，因为随着时间的变化，个体会根 
据其内在的政党忠诚度不断调整对主要政党候选人的评价。 
企业组织多少会不断调整其雇用基数以应对环境中的经济 
力董。此类模型直观上及理论上都更适合分析社会科学家 
通常研究的很多因变量，如态度及其他社会一心理概念、组 
织变迁、人口流动等等。在这种情况下，特定时点所进行的 
测量代表的只是用以观察因果过程的纯粹人为间隔内的变 
化，分析者的任务是要发现 Coleman 所说的“变化的基本参 
数' 下面即可看到，估计连续时间模型所用的方法与离散 
时间模型类似，但对参数的解释显著不同。 

我们通过模拟 Y 对时间？的导数来表达基本的连续时 
间 模型： 


= C 0 + Cl x , + Q y ( [2.16] 

Y 对 f 的导数这一概念来自代表 Y 的瞬间变化速率 
也就是说， f 变化无穷小时 Y 的变化量——的初级计算公式。 
根据这一方程，变化量的大小同时取决于给定时点上的 X 值 
和 y 值。还有很多其他模型可以用来预测 y 的变化速率(例 
如，将速率预测为常数或时间的函数等），但方程 2. 16最具 
理论吸引力.它将 y 的瞬间变化速率作为 y 及其他被假定对 
^具有因果作用的变量的函数。 

要估计这一模型，解或“求导”这一微分方程就能将 y 的 
前值表达为 r 一 1到 f 期间，方程 2. 16中各变量的累积效 
应。暂且假定外生变量 X 为恒定变量，求导方程 2. 16,得到 
如下 结果： 
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Y t = 1) + ^(^ - l)X + ^ Y t ^ [2.17] 

c t 

其中为自然对数，以为各轮调查间的时间间隔。如果在 
方程 2. 17中加上一个随机误差项以概括的其他原因，那 
么这一方程可被看做方程 2. 5稳定得分模型的另一种形式， 
以 X 和作为自变量对 K 进行 预测： 

y t — Po 4- (3 i X + + e , [2.18] 


与离散时间模型中的回归系数不同，连续时间估计模型中的 
P * 代表的是方程 2. 17中系数 c 和测量间隔的复杂非线性函 
数。不过，只要满足关于残差项的标准假定，且没有设定错 
误或测量误差，氏就可以通过 () LS 进行估计,而上面的系数 


对应“变化的基础参数 




可以这样反求出来 


t'o = po 


In ^2 

AKp2 ~ 1) 




Pi 




— 1) 




In 

At 


[2, 19:| 


一 个例子 

我们将用1980年美国全国选举跟踪调查数据来说明上 
述方法.这一数据包含了对随机抽中的763名符合选举年龄 
的成年人的调査结果，调查分别在1980年的1月、6月、9月 
和11月进行 9 有关总统选举期间的态度变化的研究显示， 
对于候选人的态度受到个体政党忠诚倾向的直接影响，因而 
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高度认同共和党或者民主党的个体，对自己政党推举的候选 
人的评价在竞选结尾阶段比开始时更为积极，但对反对党候 
选人的评价，随着时间推移会越来越差 （ Markus , 1982)。在 
该研究中，受访者被要求在一个100分的“感觉温度计/民意 
评分”量表上，对两个主要的政党候选人 一一 共和党的罗纳 
德 • 里根 （Ronald Reagan ) 及民主党的吉米 * 卡特 （Jimmy 
Carter ) ——打分，在此基础上构建出一个变量，代表对两个 
候选人的打分差异，使正数得分表示对里根的评价更髙，而 
负数得分表示对卡特的评价更高。在下面的分析中，我们将 
6月这一变量称为 THERM , ，而9月为 THERM 2 。我们用6 

月的一个7分政党认同量表作为自变量，取值从“坚定的民 
主党员”一直到“坚定的共和党员”。下面的系数、标准误及 
标准化系数是从方程 2. 18的 0 LS 估计中得 到的： 

THERM 2 =— 2, 05 + 3. 74 PID ] + 0, 66 THERM ! 

[ 2 . 20 ] 

(0. 99) (0. 54) (0. 03) 

0. 20 0. 65 

两个自变量的系数都统计显著，模型总的确定系数 茫 为 
0.59。估计结果为1980年竞选过程中“(候选人）民意评分” 
的党派极化假设提供了支持。政党认同度朝支持共和党方向 
每增加1个单位，与个体 S 月到9月间对候选人的相对态度评 
分向支持里根(反对卡特)的方向变化 3. 74个单位显著相关。 
在控制政党认同后，6月的评价水平对9月的评价水平的效 
应为 a 66,也就是说，这一模型表明，6月的评价得分对6月 
至9月间评价得分变化的作用是 一 0. 34(0. 66 _ 1) 。 
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从连续时间的角度来看，方程 2. 20中的系数 Pj 用于求 
岀潜在微分方程中的系数 C ，这一系数描述了政党认同对候 
选人评价变化的瞬时速率的影响。根据方程 2. 19的相等关 
系，如果假定以取值为3与两轮调查间为期3个月的间隔对 
应，那么候选人评分)对 Y 相对于时间 f 的导数的作用 
为 一0. 14,而政党认同(足-0的作用为 1. 53,截距 c 。 的估计 
结果为 0. 88 a 

这些系数给出了有关这一因果系统的重要信息。第一， 
系统是稳定的，也就是说，由于存在系数( — 0. 14) 所代表 
的“负反馈”作用，它最终会达到平衡。第二4寺定案例的均 
衡 y 值，可以通过令导数式等于0来求解，即 y = c - r 0 - 

因此，如果个体在选举开始时的政党认同得分为3 
(对应“坚定的共和党人”），那么模型预测的均衡 y 值为民意 
差异量表得分39,1;—个坚定的民主党人(政党认同得分为 
— 3) 的均衡值则为 一26. 5。第三，系数 q 的大小表示 Y 向其 
均衡值移动的速度。如果 Q 很小（比如值很大的负数），那么 
在来自 X 的外生效应影响下， Y 移向均衡点的速度将非常 
快。当变大时， Y 趋向稳定状态的速度将不断变小。在这 
里， Q 取值 一0. 14表明 Y 趋向均衡的过程较慢。如果潜在 
的实际模型被看做一个部分调整过程，不断调整以趋向某 
一 H 的或期望的效应目标，那么可以证明调整参数 a 等于方 
程 2. 16中系数 的相反数 （Tuma S ■- Hannan , 1984:337 

338) 。在此， a 估计值 0. 14表明 Y 趋向渴望月标的速度非常 
慢，•这和均衡论解释是一样的。 

连续时间模型可以被扩展以处理外生变量在跟踪调查 
期间发生变化的情况^在这种情况下，要想反求出方程 2. 16 
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中的系数^就必须对 X 的历时变化模式作出一些假定。在 
x 的变化为线性模式的简单假定下，估计模型中增加另外- 
个因素 (AX) 后所得到的积分方程的解要在方程 2. 17 中加 
上如下 部分： 

^ € A -1 AX [2. 21] 

c 2 L 」 

在这一方程中， AX 前面的数量即用 Km 、 及-,及 AX 预测 
Y , 的回归模型的系数氏<= 

如果 y 到 x 之间不存在反馈效应，并且误差项表现良 
好.这一模型同样可以用 OLS 方法进行估 ih 对于政党认同 
的例子，这种估计的结果为： 


THERM, = 一 1. 61 + 4, 33 PID, +0. 64 THERM [ +3. 27 APID 

[ 2 , 22 ] 

(-0.97)(0, 23) (0.03) (0_ 96) 

0.63 0,23 0_08 

括号中的数字为标准误，带 K 划线的数字为标准化系数 ， P 
为 0. 59。要将 OLS 系数转化为微分方程中的参数 c ， 就必须 
首先根据上面的方程 2. 19 从择 估计出 c 2 . 然后利用其他两 
个回归系数产生 P 1 D 效应 r , 的两个 估计: 一个来自类似方程 
2.19 的系数沐，另一个来自系数 p 3 ; 



[2. 23] 


在这个例子中，从系数印估计的0取值为 1. 79,而从艮估 
计的取值为 2. 57。不管是哪一个，都表明早前在外生变量 
固定不变的假定下得到的系数 L 53低估了政党认同对候选 
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人评分变化瞬时速率的真正影响。 Tuma 和 Hannan ( 1984) 
讨论了将这两个取值组合起来并从数据中得到关于^的多 
种最佳估计方法，从简单的代数平均值一直到混合的最大似 
然估计法」 :7] 因此，连续时间模型中足_,及 AX 对应的两个 
系数被用来提供 X 对 Y 的“连续同步”影响的单一估计。 




上述讨论看起来会让人以为面板数据背景下的因果推 
论只是一个简单的 问题： 设定连续或离散的稳定得分模型， 
通过 OLS 回归对因果作用进行估计，然后将其解释为控制 

后， x 对 y , 或 ay 的影响。但即使是在最基本的稳定得 
分方程中，也存在几个妨碍因果推论成功进行的障碍，这些 
潜在问题经常使一般最小二乘法不适合作为面板分析的估 
计程序。最重要的问题来如下可能的模型设定错误。 

第一，互为因果。如果 x 和 y , 在一个交互因果系统中 
相互影响，那么 OLS 将产生有偏且不一致的参数估计，从而 
必须寻找其他需使用更多变量或更多观察轮次的估计量。 

第二，测量误差。如果未被准确测量，那么其对 K 
的实际影响将无法得到确切估计，也就不适合作为 Y 的前期 
水平与后续变化间常见的负向关系的恰当控制。确实，如上 
面讨论过的，的测量误差是与 AY 之间负相关的可 
能根源之一，但试图通过直接在模型中纳人以纠正问 
题，又会因为自变量带有误差时的有关统计估计问题而引人 
新的偏差。这种偏差通常会低估，对 Y , 的影响，高估其 
他解释变量的影响。 

第三，被遗漏变量或自相关的扰动项。最后.被遗漏变 
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1可能给面板模型带来几种类型的偏差。除了由被遗漏变 
量与观察自变量之间的相关而导致的常规设定偏差外，面板 
模型中被遗漏变量还能导致外生变量不同时期的误差项之 
间的自相关。这又会使、^和 e , 之间产生非零相关，最终使 
稳定得分模型中 Y t 效应的 OLS 估计不一致。如果其 
他自变量与相关，自相关扰动项也会使它们对 K 影响 
的估计有偏。 

稳定得分模型中的这些设定与估计问题将成为本书剩 
余部分讨论的内容。尽管这些问题给成功的因果推论带来 
了臣大的障碍•但我们将看到，在这些困难面前，跟踪调查数 
据往往能提供足够的信息以成功佔计出这些参数。另外，这 
些问题中很多是在所有经验研究中都存在的，而且在后面我 
们将看到，和截面分析相比，跟踪调查数据为研究者控制这 
些问题提供了大得多的力量。 
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上一章的模型都假定X和 Y 之间为单向关系，也就是 
说，只有X影响 V. 不存在相反的影响 。 在部分情况下，这一 
假定完全适用。例如，在分析种族等先天特征对个体收人变 
化的影响模槪中.或者模拟成年前期的经历对后来的政治及 
让会取向的研究中.变 M 之间的时间顺序（进 而潜在 的因果 
次序)是清楚的。在另一些情况下，理论原因将避免对交互 
因果关系的检验.例如，在试图模拟一组被长期观察的国家 
中经济指标对政府声望的影响的研究中就是这样，在这种 
模型中，X、又^和（或） iY 可以被当做相应方程中的外生 
变跫来对侍.而参数估计可以通过< >LS 冋归获得^再者，如 
果没有测 M 误差或自相关误差项的假定无法满足.可以通过 
后面的章节即将讨论的其他方法来获得， 

不过在很多分析中，单向因果假定是站不住脚的，而且 
实际上，进行跟踪数据分析的主要原因之一就是为了确定所 
关注的变量之间的因果顺序9例如，在前面的章节中，我们 
假设群体成员资格会影响一个人的抗议行为倾向，而个体按 
期的政党认同会决定其在一次竞选过程对总统候选人的感 
觉.但是有关的参与及组织动员理论认力.参与抗议活动考 
能会导致个 体参与吏多其 有抗议倾向的绀织，而政治参与理 
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论认为 * 对政治候选人的态度也会改变个体长期的政党认 
同。在这些情况下，不同理论将使我们怀疑X和 之间存在 
交互因果关系。 

相对于截面分析.面板数据在检验变墩间可能存在的交 
互因果作用上具有绝对优势。由于截面数据是在一个时点 
上收集的.交互效应模型中能设定一个变量对另一个变讀 
的同步或同时因裝作用.而且对交互因果作用的估计需要通 
过将外部变量整合进“工具变 M” 分析或二阶段最小二乘分 
析来进行 (Berry， 1984)。不过.下面我们将看到，这些方法 
成功与否取决于模型是否满足几个商关这些外部变 M 与入、 
V及相应方程的扰动项的关系的严格假定。如在第2章中看 
到的,面板设计的历时特性允许研究者估计带滞后因果作用 
的模型，在这种模铟中.X的早前值会影响 Y 的未来取值（或 
Y 的变化）或者相反 （K 的早前值会影响X的未来值）。另 
外,带有同步或同时因果作用的模型可以在不对外部工具变 
M 的影响作出假定的情况 f 得到识别和估计，这些假定可能 
是靠不住的•但在截面研究中却是必要的。 

本章将展现在交互作用模型中使用面板数据协助进行 
因果推论的主要内容 . 我们将强调面板设 P 是估计交互因 
果作用的有力手段，尽管它们无法提供自动“证明因果关系” 
的方法。交互 因裝关 系的估计总是发生在特定的假设模型 
中•这些模型所包含的假定在特定情境下（是否成立）必须进 
行论证。具体来讲.二期数据交互效应模型所涉及的一系列 
可能的严格假定与在截面研究中一样•只有通过纳人外部变 
M 才能被 放宽 。但三期或多期面板模型只需给因果参数较 
少的限制，就能被估计出来。 
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第1节 I 交叉滞后作用模型 


二期数据模型 

对可能的交互效应进行估计的最基本的模型是将上一 
章讨论过的滞后作用稳定得分模型 （ 方程乙 : U ) 扩展成两个 
因变 M 的形式，每个因变量在时间2 _h 的取值都由其早前值 
及另一个相关变 M 在时间〖上的取值来解释。该模型用路 
径图的形式呈现在图 3. 1中。 X ,和分别代表一个变量 

(如群体成员资格数)在两轮调查中的取值.而 Y , 和 K 分别 
代表另一个变廬（如抗议倾向）在两个时点上的测量结果。 

和匕被假设由它们各自在第一轮调查中的取值和另一 
个变 M 的滞后值以及误差项 U 来决定.笫一轮变量之间的 
相关由图 3.] 中的 Pl 代表.第二轮方程中结构性扰动项之间 
的相关由表示。两个结构方程可以写成如下 形式： 






图 3.1 带交叉滞后作用的二期数据模型 
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y 2 二印不 + p^+la 

[3,1] 

X 2 = H "^ X | + C/2 

上述模型中的所有变量都被表达成离均差的形式以消除截 
距项。 

交叉滞后模型在面板分析中用途广泛。当因变量的变化 
按离散时间过程被拟合时，只要因果时滞约等于各轮测 M 间 
的间隔，交叉滞后模型就是适用的。当因变量的变化连续发 
生时，可以证明交叉滞后模型代表一组微分方程的积分解，在 
该组方程中， x 和 y 的瞬时变化速率相互决定•如下 所示： 


免 = 0 ) +c { X t +c 2 Y t 

= 4-^sXj 


[3,2] 


与上一章讨论过的单方程连续时间模型一样，方程 3 . 1 中 
的氏是方程 3. 2中的“变化基础参数” r 以及各轮调査间的 
时间的非线性函数。从氏计算系数 r 时，所涉及的复杂数 
学运算已经超出了本书的范围，感兴趣的读者可以从 Arm - 
inge . r (1986)、 Coleman ( 1 968*448 一 452) 以及 Tuma 和 Han - 

nan (1984 : 第11 一 12章）的著作中找到更详细的内容。就 
我们的月的而言，只需知道当因果系统是从一个变量到另 
一个变量的连续交互反馈系统时，交叉滞后模型“在因果作 
用的方向上一般是不会犯错的” （ Dwyer , 1983: 352) 就足 
够了。 

另外可能注意到，这一交叉滞后模型对应于时间序列分 
析中所谓的因果关系的“葛兰杰检验”，后者断定在控制第二 
个变量早前取值的情况下，只要第一个变量在时间？一 1、 
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f 一 2等的测量值中，有任意一个对第二个变量在时间/的取 
值存在显著影响，那么第一个变量就是第二个变量的“葛兰 
杰原因” ( Gujarati ， 1988:542—543)。在二期数据情况下，它 

被简化为方程 3. 1所示的模型，而在多轮跟踪数据下，所得 
为通过 V 和 X 在时间 f 一 1 、2等的取值來预测7和入在 
时间 f 上的取值的交叉滞后模型。 

交叉滞后模型的估计 


起初，有人认为通过比较两个变量间的交叉滞后相关， 
即|0兄>^和卩^不，就可以确定变量间的因果方向。人们认 
为，如果 以足和 X 2 为代表的变量对以 和1 为代表的变 
量的因果作用比反方向的作用大，那么 px , y z 将大于 
P y , x 2 。 不过，后来无数学者的证明发现，这一推理过程是靠 
不住的，因为图 3. 1中变量间的交叉滞后相关是由好几个因 
素造 成的： 


pXjY z = Pj 4- pip2 

[3. 3] 

pH = 03 + pi ^ 

可以看到.交叉滞后相关不仅包含变量间的因果作用，还包 
括每个变量的历时稳定性以及第一轮时两个变量间的交互 
相关。因此，如果 Y 的稳定性强于 X 的稳定性，那么即使(3 3 
大于执，兄和7 2 之间的交叉滞后相关也会大于 X 2 和1 之 
间的交叉滞后相关 ( Markus , 1979:48—49)。由于因果作用 

的比较只有通过直接复原印和兩才能进行，因此，回归及结 
构方程法已经不再将交叉滞后相关分析作为确定因果方向 
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及强度的方法了。不过，在第5章中我们将看到，交叉滞后 
相关的比较对跟踪数据分析确实有一些用处，它可以检验某 
些变置间带有虚假相关的限制性模型。 

在误差项 C / 的均值为0、方差恒定，且与滞后外生变量 
X ,和 A 无关的假定下，交叉滞后模型的参数可以通过一般 
最小二乘回归得到一致的估计，如前面已经提过的，这一模 
型中最让人感兴趣的是第一轮变量 X ,和分别与 Y 2 和 
x 2 之间的交叉滞后作用，因为它们被假定代表一个变量对 
另一个变量的因果作用。用上一章讨论过的变化得分语言 
来说，在控制 Y , 的情况下，兄对 y 2 的影响代表对 y 的 
历时变化的影响;控制兄后的 I 对； c 2 的影响可进行同样 
的解释。通过 x 2 和匕方程的圮就能看出滞后变量对因变 
量的方差的解释程度.而误差项 c ;, 和之间的相关则代表 
未被模型中的交叉滞后(或连续时间）因果过程及稳定效应 
所解释的 x 2 和 y 2 之间的共变 

将第2章中用群体资格数解释德国人合法政治抗议倾 
向的分析拓展一下，就可对这一方法进行示例说明。在前 
面，我们假定抗议倾向与群体成员资格之间是单向因果关 
系.但对图 3. 1所示的交叉滞后模型的估 il 结 果显示，两个 
变量对对方都有显著的影响。这一模型的 OLS 估计结果(包 
括括号中的非标准化冋归系数、标准误以及带下划线的标准 
化系数) 为： 

PROTEST = 0.22 + 0. 04 GROUPS , +0.47 PROTEST , 

[3.4] 

( 0 . 02 ) 


0. 11 


(0.05) 
0. 47 
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其调整 的记为 0.21 另一 个为： 

GROUPS =0.01+0.58 PROTEST , + 0. 46 GROUPS , 

(0. 14) (0. 05) 

0 . 20 0. 42 

其记为 0.29。 两个方程中的回归系数都统计显著 a 这一结 
果表明，根据这一模型，第一轮调查时，个体拥有的鼓励抗议 
群体的成员资格数对两轮调査 I㈣ 抗议倾向的变化有影响；而 
第一轮调查时的抗议倾向对两轮调查间个体所属的鼓励抗 
议的群体数的变化也有显著的影响。事实上.抗议倾向对群 
体资格数的影响的大小是我们在第2章关注过的反向因果 
作用的将近两倍，模型中两个外生变量的结构扰动因素之 
间的相关为 0. 22,与1989年 PROTEST 及 GROUPS 间观察 

到的相关系数 0. 46相比，这意味着直接观察到的两个变量 
间的相关的一半已被模型屮设定的稳定效应及交叉滞后作 
用所解释。其他因素可能包括同步因果作用和与被遗漏外 
部变量的共同相关，可解释 X 2 和之间其余的共变。 

三期或多期交叉滞后模型 

当有三期或多期数据时，可使用之前讨论过的方法分别 
估计各个时期 Q >1) 的交叉滞后模型。不过，更为常见的 
办法是使用 USREL 或相关结构方程软件在整体模型中对 
这些系数进行同时估计，因为这些技术司以扩展以处理带有 
测量误差及自相关扰动项的复杂模型，并提供模型相对于 J t 
他设定情况的相对拟合优度，还允许对系数进行限定以估计 
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我们关心的某些理论效应。 

例如，现在我们有三期数据可用来估计1980年竞选期 
间，个体的政党认同( X )与对总统候选人的评价 O0 之间可能 
存在的交互因果关系。根据我们前面的讨论，如果假定这些变 
量之间的交互影响在竞选期间是持续地进行的，那么方程 3. 2 
刻画的微分方程所代表的因果系统里的参数可以通过交叉滞后 
模型的估计复原出来。我们将三期数据交叉滞后模型呈现在图 


3.2 中，为了方便解释，我们使用 LISRKL 符号系统(见附录) 


o 



图 3. 2带交叉滞后作用的三期数据樓型 


第一轮 (1980 年2月）、第二轮 (6 月 ） 、第三轮 (9 月 ） 调查 
中的政党认同分别由图中的外生变量 tj ,、 ％及&表示，而候 
选人（支持）民意得分由 及，代表。实际上是 

事前已经确定的变量，不过在这里，我们将它们作为完全由 
它们的误差项决定的内生变量，这样，变量间所有的因果作 
用都处于 LISREL 内将所有内生变量连接起来的系数矩阵 B 
中。这一设定不会对实际结论产生任何损害 ，但: E 如接下来 
将讨论的一样，只有这样，才能在各轮次间的私上加上相等 
的限制。在 USREL 设定中，这一模型只有两个相关的矩 
阵: B 矩阵和内生变量的结构扰动项&之间的方差协方差矩 
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阵平。 ，和 匕之间的协方差如代表变量％和％在第一轮 
调査时的协方差，匕和匕以及匕和匕之间的协方差小代表 
通过模型中设定的连续时间交互作用过程，在第二轮及第三 
轮调查屮无法解释的政党认同与候选人评分之间的共变^ 

如前面所讨论的，连续时间模型中的氏是各变童对 X 和 
Y 的瞬时变化速率的影响以及各轮测量间的时间间隔的非线 
性函数。因此,如果各轮调查之间的时间间隔相同，那么各轮 
调查间的在也应该一样，这样，从第 - 轮调查到第二轮调查间 
各变量之间的交叉滞后作用应该等于它们从第二轮调查到第 
三轮调查间的对应取值，就像各变量的稳定性估计一样。因 
而，给参数加上如下一致性或相等性限制：氐=译 、择 =陕、 
氐=氏、印=择，那么这一模型即可被识别 D 各变量影响效应 
不变的假定可通过放宽这些限定，然后比较前后两个模型的 
拟合优度得到检验。如果各轮调查之间的间隔不等，那么给 
不同轮次间％的限制将是非线性的，而不是相等 ( Amiinger . 
1987:343)。在 IJSREL 框架中给不同轮次间的参数施以非线 
性限制尽管并非不可能，但却很难，读者可以从 Hayduk 0987) 
及 Rindsko P f (1984) 的著作中找到这些方法的应用案例。 

为了示范，在当前这个例子里，我们假定结构效应是稳 
定不变的，尽管第一和第二轮调查之间的间隔比第二和第三 
轮之间长了大概一个月。另外，我们还假定如=咖 3 ,也就 
是说，第二轮调查中政党认同与候选人评分的扰动项之间的 
协方差与第三轮调查中的相等。其他所有误差项的协方差 
(除如外)都被假定等于0,这在本模型中，相当于假定各误 
差项不存在自相关。这些假定同样可以被放宽，并通过数据 
进行检验，更多细节将在第5章进行展示。在对结构性参数 
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及扰动项施加了这些限定后，模型已经过度识别并带有九个 
自由度，该模型的 USREL 最大似然估计结果在表 3. 1中显 
示。结果表明，政党认同与候选人评分之间存在显著的交互 


表 3. 1三期数据交叉滞后作用 模型: 政党认同与对候选人的评价 （1980 年} 



非标准化系数 

标准化系数 

稳定效应 



候选人评价 




0. 67" 

0.62 


0. 67 a 

0.64 

政党认同 



P4 

0. 83 b 

0.82 


0.83 b 

0.83 

交叉滞后作用 



政党认同对候选人评价 




3.98 c 

0.21 


3. 98 c 

0*21 

候选人评价对政党认同 




0.01 d 

0, 08 


0. 01 d 

0. 09 

误差协方差 



咖 1 

29.58 

0.44 

如2 

4-45* 

_ 0,06 

扣 3 

4. 45 e 

， ” 0, 06 

. -- m . j 

K 2 (rp) 候选人评价,第二轮 

0, 54 


1^(7}:,) 候选人评价,第三轮 

0_ 58 


记 （巾） 政党认同，第二轮 

0.73 


R 2 (T)6) 政党认同，第三轮 

0, 77 


X 2 ( df ) 

201. 1(9) 



注:表中第一列为非标准化的最大似然估计系数，第二列为标准化系数 6 所 
有系数都统计检验显著。（原朽中两种系数交替放在间一列，这里为了 
节省空间分成了两列。——译者注） 
a 、 Ik c 、 d 、 e ; 系数被限定相等。 

资料来源：美国全国选举研究，主面板文件，1980年。 
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因果作用。政党认同对候选人评分的标准化影响接近反向 
作用大小的两倍。政党认同及候选人评分的稳定性都很高， 
模型得到的第二轮、第三轮数据中，政党认同及候选人评分 
的扰动项之间的标准化协方差取值很小，这意味着模型能够 
很好地解释这两个变量间的同步共变。 

不过，可以看到，正如九个自由度下的 X : 值 201. 9所示, 
模型对数据的拟合非常差。将不同轮次的结构参数相等以 
及政党认同与候选人评分的扰动项之间的协方差在第二轮 
和第三轮中相等的假定放开后，得到的结构效应估计几乎相 

同，对应的为四个自由度下的取值190.2。由于第一个模 

型是“嵌套”在第二个中的，两个/之差同样服从 x 2 分布。 

'V 

在本例中，之差为10.9,对应的自由度为5,这意味着不带 
相等性限制的模型在数据拟合度上并没有统计显著的改进。 
同时，由于整体拟合水平很差，模型还需要进一步的调整。 
在章中，我们将考虑放宽无测 M 误差及结构扰动项之间 
不存在自相关的假定。 
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第2节 | 同步作用模型 

- - •: : : 乂. ;： 


交叉滞后模型的估计方法相对简单，这无疑有利于使其 
成为流行的、处理因果关系的工具。但回忆上一章可知，这 
些模型中有关同步或同时效应为0的假定（也就是说，变量 
间的因果作用仅仅来自兄和的滞后变量的影响）在很多 
研究情境下可能并不成立。当面板模型各轮测量的间隔相 
对于实际的因果时滞较长时，仅仅估计交叉滞后作用将无法 
完全刻画每个变量对其他变量的全部因果影响。另外，在有 
些模型中，交叉滞后作用的假定事实上是不成立的，如在 

皆 

Dwyer 有关大学新室友与其他室友情绪的交互影响的例子 
中就是这样 ( Dwyer , 1983：393) 0 变量间的同步或同时影响 
的出现，使其他估计交互因果作用的方法成为必需。 

在有些情况下 ，一 个适当的因果模型在特定时点上，各 
变量间只具有同步交互效应。在另一些情况下，变量间可能 
同时具有同步作用和交叉滞后作用，其中滞后值将解释变量 
部分而非全部的因果影响。同时包括滞后及同步作用的模 
型在识别和估计上会出现一些特殊问题，这个问题将会在介 
绍完相对简单的同步作用模型之后讨论。后者在两轮数据 
下的情形呈现在图 3.3 中,其对应的方程组为： 
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x 2 和之间设定的交互作用意味着模型成为非递归 
模型，并给 OLS 估计带来了问题 ( Berry , 1984)。因为 X 2 与 

U , 相关(后者通过 A 形成间接影响）， h 与 t / 2 之间的关系 
相似，使与 OLS 中有关自变量与因变量的扰动项无关的假定 
被违反（如果总 体中氏 和氏不等于0)，因而 OLS 估计将对 
模型中的因果参数产生有偏估计。另外，很多非递们模型中 
的参数是无法识别的.因而我们必须确保观察到的方差协方 
差信息足够多 * 从而估计出感兴趣的系数。 


图 3. 3带有同步作用的二期数据模型 


要识别和估计方程，模型必须含有一个以上满足如 
下条件的“工具变量”:（1 ) 与不 相关但与 U 无关; （2) 对 h 
没有直接的因果作用 =■ 要识别和估计不方程，至少需要一 
个与 h 相关但与[； 2 无关，且对 X 2 无直接因果关系的工具 
变量。在当前模型的假定 F ， 滞后变量 X , 和1 就满足这两 
个条件。因为它们被假定为是先定变量，所以从定义上讲， 
它们与两个方程的误差项 无关； 另外，由于模型假定两个交 
叉滞后作用都为0,所以第二个条件同样得到满足，因此，两 
个方程都满足必需条件而恰好识 别：两 个各带有一个内生变 



第 3_ 章交互因果檳型 


量作为自变量的方程中，都有一个外生变量(技术上讲，先行 
确定的)被排除在外。能够利用滞后因变量来估计交互效 
应，是面板分析被公认的主要优势之一。不过需要注意的 
是，这种估计方法只有在满足严格的假定基础上才有效，包 
括不存在交叉滞后作用、连续的各轮调查的方程的误差项之 
间不存在自相关等。这些假定中只要有一个不满足 ，兄和 
Y , 就不能分别用来识別 X 2 和方程 （ Berry ， 1984)。 


同步作用模型的估计与评价 


由于同步作用模型中每个参数都恰好被识别，因此它们 
的取值可以通过对模型的四个“标准”方程，即两个内牛.变量 
m 分别与两个外生变量 I 和兄 之间的预测协方差 
进行代数运算来估计。这些标准方程是这样得 到的: 将两个 
内生变 a 方程分别乘以每个外生变量，对所有案例全部加 
总，然后取期 望值： 

Cov ( X , X l ) - ^ VarCX ,)-]-^ Cov ( X , Y 2 ) 

Cov (. Y } X 2 ) = j 3 2 Cov ( X , yt ) + p ,, CovCyiY 2 ) 

' [3. 6] 

Cov ( XiYz ) — [3] Cov ( XiYi ) + p 3 Cov(Xi X 2 ) 
CovCYjVz ) = ^ Var < yj ) + J 3 3 Cov ( V , X z ) 

氏和氏由前两个标准方程计算得到 小和氏 由后两个计算 
得到。 

同样，这些参数也可以通过统计程序，如两阶段最小二 
乘 ( TSLS ) 从样本数据中估计出来，也能通过 LISREL 的最大 
似然估计或有关程序估计出来。不过,在此我们主要关注二 
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阶段最小二乘法，以说明工具变量模型的运作逻辑。对于 K 
方程， TSLS 法首先将对其工具变量 I 及模型中所有其 
他先决变量进行回归，由此 得到： 


^2 — pb + piYi - h ^ X ] [3.7] 

请注意，所有先决(外生)变量，哪怕是 I 这样随后即导 致1 
但并未明确设 定为不 的原因的变量，都被用于第一阶段方 
程，目的在于得到 X 2 最好的可能估计，因为第二阶段方程的 
系数的标准误直接取决于第一阶段估计的精度 （ Berry ， 
1984)。这是使用滞后变量作为工具变量的另一个优势，因 
为 I 和兄与它们在时间2上的取值的相关，很可能比和其 
他潜在外生变量的相关强。现在不的估计值已与误差项 
U , 无关，因为它是先定变量的线性组合，在定义上就与模型 
中所有的误差项无关^程序第二阶段将替代值芡 2 代入方程 
3. 5,所有的系数及对应的标准误都可以通过 OLS 得到一致 
的估计。两阶段过程被用来 产生不 方程 3. 5中各参数的一 
致估计•.将 K 对工具变量 K 及其他先定 变量兄 进行回归， 
产生一个与 K 无关的，然后在第二阶段 将&对 $ 2 、 X , 
进行回归。上面讨论的假定，即兄对 k 无直接影响以及 y , 
对不无直接影响，在这里非常重要，否则每个方程都会无法 
识别 ：元和 么将成为它们对应的方程 3. 5中所有其他自变 
量的线性组合，从而无法得到因果作用的唯一估计^ 

尽管也可能把这呰分析分成独立的两步进行，但目前的 
统计软件通常带有的两阶段最小二乘程序都是同时对两步 
中的系数进行估计。使用这些程序的优点不仅在于计算方 
便，更重要的是它们还能提供正确的标准误、标准化回归系 
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数以及第二阶段方程的记等，这些程序中统计量的计算是 
基于不 和 Y 2 的原始值而非预测值 ( Berry ， 1984:68—69)。 

用来自前联邦德国跟踪调查研究中的抗议倾向与群体成员 
资格的例子根据上述步骤计算，得到如下估计 结果： 

PROTEST 2 = 0. 22 + 0. 09 GROUPS +0.42 PROTEST , 

[3. 8] 

(0.04) (0.06) 

0. 26 0. 42 

R 2 为 0. 30, 另一 个为： 

GROUPS — 0. 27 + 1. 24 PROTEST +0.41 GROUPS , 

(0.29) (0.05) 

0.42 0.37 

R 2 同样为 0.30。 和交叉滞后模型中一样，两个方程的所有 
系数都在统计1二显著。 

乍一看，同步作用模型似乎比前面估计的交叉滞后模型 
更好。两个因变量被解释的方差比例都要大一些，抗议倾向 
与群体成员资格之间的交互因果影响更强。不过，同步作用 
模型一个很吸引人的特征在于，它还存在一个自由度，这可 
以用来检验模型的一个重要假定。尽管通过上文的介绍我 
们看到，在同步作用模型中，每个参数恰好被识别，但整个模 
型具有—个自由度，因为总共有 1() 个观察的方差、协方差， 
但只有9个参数需要估计 U 个|3、 L 7 的两个方差、兄和 K 
的方差及协方差 Pl )。 该自由度可以用来检验模型中有关内 
生变量的误差项之间的协方差为0,即 pt # =0的设定。这 
一残差协方差等于0的设定意味着，模型中的同步作用及变 
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量的稳定性可以完全解释变 M 和 h 之间观察到的共变。 
在当前的例子中乂/,和 a 之间估计的协方差为 _ o . 05 ,标 
准化取值为一 0 . 45, 这一取值过大，实际上不太可能。 m 

尽管跟踪数据同步作用模型的扰动项之间可能存在负 
的协方差.但这样的结果解释起来比较麻烦。它意味着存在 
一 个外部因素对这两个（正向）交互相关的内生变量中的一 
个具有正向影响，对另一个却是负向影响。这种因素实在难 
以想象，更有可能的解释是模型设定不正确。 Gillespie 和 
Fox (1980) 表明，很多同步作用模型的误差项之间出现负的 
协方差估计值可能与某些类型的模型设定失误有关，其中内 
生或外生变量存在测量误差、交叉滞后作用的排除、同时对 
外生及内生变量造成影响的变量的遗漏等.在面板模型中都 
意味着变量各时点的误差项之间存在自相关。除了内生变 
量的测量误差外，这些错误设定都会导致同步交互效应的计 
算往上发生偏误。如果不是因为残差项之间的负向共变所 
代表的“纠正”，模型将高估内生变量之间的共变。 [9] 因此，如 
果残差协方差为较大的负值，那么在同步模型中发现的正向 
交互效应可能只是模型设定错误的产物而已。在这种情况 
下，可以像下面讨论的那样，将交叉滞后作用纳人模型，而 
且/或者可以参照后面章节将讨论的方法对模型进行估计， 
这些程序可以对由测量误差和遗漏变童造成的可能偏差进 
行检验 a 
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第3节 | 交叉滞后及同步作用模型 






如果没有令人信服的理论原因来估计一个只带交叉滞 
后作用或同步作用的模型，或者同步作用模型所得到的结果 
不可能或无法解释，那么，同时带有两类效应的模型将是合 
理的替代设定不过，在图 3.3 中加上 从1 到&以及从 A 
到匕的交叉滞后作用，将使模型有11个自由参数（需要估 
计），但只有10个方差及协方差观察值^模型整体以及各个 
单独参数都将无法识别。这一识别问题在交叉滞后模型中 
是通过将同步作用限定为0来解决的，将交叉滞后作用限定 
为0才能使同步作用模型的参数被识别。假定两类效应都 
存在时，只有通过其他更多信息——或以外部变量的形式， 
或以更多调查期次的形式——才能使模型得到识别。 


二期数据模型 


当只有二期数据时.识别这一模型的唯一方法是纳入外 
部外生变量并将它们的某些影响设定为0。要想识别 A 方 
程，至少需要纳人一个满足前述工具变董分析条件的外部变 
量 (乙） ，这些条件为： （ 1 ) 它必须对不有直接的因果作用，但 
对 h 没有； （2) 它必须是外生的，因而与％和以 2 都不相关。 
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同样，至少需要再纳人一个外生的且与有直接因果关系 
但对 x 2 没有影响的外生变量 （ z 2 ) 才能使方程可识别。 
叫以想象,这样的变量很难找到，尤其是在进行跟踪数据二 
次分析时，因为在调查中并未特意测量此类工具变量。另 
夕卜,这些外部变量需要与内生变最具有相当强的关联，才能 
提高第二阶段估计的效率。研究者不能仅仅为了模型的识 
别而任意给外部变童施加限制.因为所得估计结果的偏差程 
度与丄具变 M 违反必要假定的程度直接相关。经过理论斟 
酌而推导出来的工具变量是最理想的。在其他情况下.逻辑 
理由能够支持某些关系的设定，如 Jennings 和 Niemi 就在一 
个交互效应模型中，将父母的政党认同设定为每对夫妇自身 
政党认同的工具变量 (Jennings Niemi , 1975)。在理讼上， 
很难假定妻子父母的政党认同会对丈夫的政党认同产生直 
接的因果影响，反之亦然。 

在实践中，使用个体层次数据进行面板分析时，通常使 
用社会背景变量，如受教育水平或年龄作为工具变量，因为 
它们常常被认为是固定的外生变量，因而与误差项不相关。 
但是，如果这些变量在第一阶段方程中 对不或 h 的影响不 
大,那么第二阶段方程中所有系数的标准误都将变得相对不 
精确。另外，如果作为 K 工具变量的2变量事实上对 X 2 有 
直接影响.那么第二阶段的方程将会设定错误，所得结果将 
是有偏的参数估计。就此而言，最理想的情况是跟踪调查之 
初就已将工具变量作为调查设计的一部分，因而能事先设定 
—些对不或影响相对较大，但与它们对应方程中的误差 
项无关的外生变量。 

带有合适工具变量的交叉滞后作用及同步作用共存模 
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型可以通过两阶段最小二乘法或在 USREL 框架下用最大 
似然法进行估计。 TSLS 的估计过程如前 所述: 要得到 K 方 
程的系数，就要将 X 2 对 X ,、 A 及乙进行回归产生爻 2 ,然 
后将 h 对尤、 Y , 及兔进行回归；要得到 X 2 方程的系数， 
就要将对 k 、 x , 及 z 2 进行回归产生，然后将；^对 
及匕进行回归^与前面的例子一样,通常建议使用 
现有统计软件中的 TSLS 程序以正确估计结构系数及模型 
的有关统计指标。 

对 L 1 SREL 矩阵进行简单设置，就可得到（模型的）最大 
似然估计。将足、 Y , 、4及 Z 2 设定为外生自变量， X 2 和 
设定为内生变量1和来自时间1的变量与 Z 变量的效 
应在连接外生变量和内生变量的 r 矩阵中进行设定*设定 
时，根据工具变量在因果系统中的假定角色，将单个的7元 
素限定为0。在本例中 ，从乙 到 y 2 和厶到 x 2 的 7 效应都 
被设定为 o a 为了完成因果设置，还需要将 b 对角线两边的 
元素都设定为自由状态，以代表时间2上 x 和 y 之间的交互 
影响。由于总共有21个被观察的方差及协方差值•但只有 
20个自由参数(外生变量方差协方差矩阵 ® 的10个元素、2 
个 P 、 6个 7 以及时间2上变量的2 个+ 的方差），模型仍然 
还剩一个自由度。如前文所述，这个自由度可对结构扰动项 
K 和 l/ 2 之间的协方差等于0这一假定进行检验。 

估计此类模型时的一个潜在问题是交叉滞后作用及同 
步作用之间的多元共线性问题。由亍受工具变量、因果作用 
的大小以及变量历时稳定性程度的影响，模型可能无法同时 
获得对交叉滞后作用和同步因果作用的精确估计。如果共 
线性很严重，基于对标准误和参数估计间的相关程度的检 
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査，只能对两个因变量对某个因变量的联合效应进行检验 《• 
例如，一个同时将群体成员资格对抗议倾向的交叉滞后和同 
步作用限定为0的模型嵌套在同时包含这两个效应的模型 
内。如果是用二阶段最小二乘法来估计参数.那么可以进行 
一个 F 检验以确定相对于限制模型，非限制模型是否显著具 

有更多的解释力。而在 LISREL 中， X :; 值之差在一定的模型 
自由度之差下，能检验非限制模型是否比不带因果作用的限 
制模型更能解释观察数据。这样，研究者就能确定一个变 M 
对另一个变量的交叉滞后及同步作用是否联合显著 。 Mayer 

和 Ca rr0 U( 1987) 列出了另外一些 f 差检验以帮助确定除变 
量的稳定性外，变量间的所有交叉滞后作用、全部同步作用 
或者全部因果作用是否统计显著。 

上面列出的方法概括了估计二期数据交互效应模型的可 
能方法。当存在很强的理论依据以假定某-时滞结构时•无 
论是将同步作用设定为0,还是将交叉滞后作用设置为0,模型 
都可被识别。当研究者事先没有足够的理由将其中一类效应 
排除在外时，那么带有两种效应的模型只有在纳人外部变量 
并对它们的因果作用施加 了限制 之后，才可被识别和估计。不 
过，如果模型无法拟合数据，放宽这些限定将导致模型无法识 
别;另外，如果怀疑存在自相关误差，为了进行估计，还必须有额 
外的工具变量。因此，在很多情况下.两轮数据分析只能提供非 
结论性的结果，从而使得三期或多期数据的分析成为必要。 

三期数据模型 


如果釘 三期或多期数据，估计带有交叉滞后作用及同步 
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作用的模型时，就能更由地对因果作用参数进行限制或检 
验。一种可能的做法是,在所关心变量的第二轮及第三轮取 
值之间设置交叉滞后和同步作用，而将第一轮调查值作为 t 
文 TSLS 或最大似然估计过程中的工具变量。不过，一旦控 
制&后对 x 3 (或者控制后, y , 对 l ) 没有直接影响， 
工具变量法就会崩溃。另外，模型将无法提供精确的历时因 
果过程描述，因为它忽略了第一轮变量和第二轮变量间所有 
的因果关系。 

另一个选择是，通过扩展图 3. 2所示的 LISREL 交叉滞 
后模型并给模型参数施加其他限制，对三期数据模型进行估 
计^我们可以在图 3. 2的模型上增加下面这些参数代表全 
部交叉滞后和同步作用设定:％、卩„代表时间2和时间3上, 
一 个变量对另一个变量的同步 作用; 氏。、 如代 表时间2和时 
间3 L 对应的反向效应。整个模型具有2个自由度，因为6 
个观察变量总共有21个方差协方差值，而需要估计的自由 
参数为19个——12个 p 参数、6个结构性项的方差、1个时 
间1 h 结构扰动项之间的协方差。不过，第二轮及第三轮内 
生变量的方程没有一个可解，因为每个预测方程中的内生变 
量都比遗漏的先定变量多。通过纳人外部先定变量，并对它 
们的因果作用施加某些限制，是使这些方程可解的一种策 
略，不过,正如我们已经知道的，这样的变量很可能无法实 
现，或者此种程序背后所做的假定在给定的情境下站不住 
脚。识别这一模型的另一可供选择的策略是给参数施加一 
些相等性限制（即令某些参数相等）。 Kessler 和 Greenberg 

(1981) 表明.只需施加 K 述限定中的两个，即可使模型得到 
识别，如果将三个限定都加上，模型就会过度识别 ： 氏=氏， 
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决= 氏， 由=知。第一个限定使一个变量的稳定性在相邻几 
轮调查之中相等，第二个限定使第-轮调查与第二轮调査之 
间的一个变量对另一个变量的交叉滞后作用等于第二轮和 
第三轮之间对应的作用。研究者应该注意的是，必须而且只 
需对一个变量的决定因素施加限制。在上述模型中，如果相 
等性限制被施加在方程％、 TJ6 的参数上，那么方程平、 7)3 的 
参数仍然可以不加限制地得到估计。不过，在多数情况下， 
很少有理论支持我们限制一个变量对另一个变董的效应。 
研究者可以在初步模型中，对两个变量的效应都施加相等性 
限定，然后在后续模型中视情况放宽这些限定。如果能够获 
得多轮调查数据•额外的自由度就能够为我们提供足够的信 
息，以对模型的参数（包括扰动项的协方差）进行估计，而无 
需像三期数据时那样设置众多的相等性限制。 

我们用来自全国青少年调査的数据检验这个模型，该调 
査从1976年开始，对1725名12岁至17岁的美国青少年进 
行追踪调查，在此后四年中对他们进行了访问，不过这里的 
分析只限于整个调查的前三年 (1976 年至1978年）。调查测 
量了青少年自己报告的违法行为、药物及酒精服用情况*还 
有众多在心理学及社会学文献中被认为可以用来解释青少 
年违法行为和药物滥用的变量。我们假设个体自报的违法 
行为在一定程度上由其与违法伙伴的牵涉程度/亲密程度所 
决定.同样，个体自身的违法行为也会促使其与具有相间行 
为倾向的同龄人交往（有关 NYS 调查的描述请见 Elliott ， 
Huizinga Ageton , 1985； Menard 8^ Klliott .，1990) 0 

我们通过将受访者在六种违法行为上的情况取平均值， 
建构出每个青少年在1976年、1977年、1978年的一般自报 
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违法量表•我们还询问了过去一年中他们参与所列六种行为 
的频率(取值从代表“从未参与”的 “0”，一 直到代表“每天二 
到三次”的“6”）。而每轮调查中的“与违法伙伴的牵涉程度” 
量表是根据 Elliott 等人 （Elliott et al . ， 1985) 提出的方法建 

构出来的，即将一个测量受访者每天下午、晚上及每个周末 
与朋友在一起相处的时间长度指标 (“0” 代表“从不”/‘5”代 
表“大量”)与另一个测量他们主观感知其朋友中有多少参与 
了上述六种不同违法行为 （“1” 代表“没有人”到“5”代表“全 
部”)的指标相乘。 

表 3. 2给出了这一模型几个变形的参数的最大似然估 
计结果。％到％代表1976年、1977年 J 979 年与违法伙伴 
的牵涉程度 （〖 DP );%、 ％代表三轮调査屮受访者自报 
的违法情况 （ SRD )。 表格的第一列给出的是对 SRD 及 1 DP 
的因果作用施加了相等性限定的模型的估计结果，也就是 
说，该模型设定了如下相等条件 ：对于 SRI ) 的方程，印= 
氏，氏 = 氏 ， ft = Pll ?对于 IDP 的方程，氐=氏，氏=降， 

PlO = Pl2 。 

这一模型有八个自由度，从 x 2 值来看，它对数据的拟合 
非常差。不过.该模型的实质性解释意味着因果交互作用遵 
循着某种被称为“反馈”的过程 （ Plewis ，1985), 在此过程中， 
变 M 间在不同时间间隔上构成相互影响《在这里，变 M IDP 
到 SRD 间存在显著的同步作用.而 SRD 到 1 DP 之间存在显 
著的滞后作用。在本例中，这一模式实际上具有合理性，与 
违法同龄伙伴的交往会影响个体同期的违法行为，而违法行 
为会使个体在接下来的一年内与具有类似行为倾向的伙伴 
交往。 
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表丄2三期数据交互作用 模型： 

自报违法行为及与违法同龄伙伴的交往深度 （ 1976 — 1978年) 



模型 （1) 

模型 (2) 

模型 (3) 


系数 

标准化 

系数 

系数 

标准化 

系数 

系数 

标准化 

系数 

稳定效应 







SRD 







P 2 

aw 

0.41 

0. 37^ 

0.37 

0* 35 

0.36 


0.40 a 

0,38 

(X 37 a 

0* 35 

0. 40 

0. 37 

IDP 







(34 

0. 54 b 

0. 45 

0. 59 b 

0,49 

0,61 

0,49 

交叉滞后作用 

SRD 到 IDP 

0, 54 b 

0. 18 

(X 59 b 

0.51 

0. 56 

0.51 


2 + 83" 

0.37 

L 74" 

0.23 

L 67 

0, 22 

|3? 

IDP 到 SRD 

2. 83 c 

0, 42 

l _74 c 

0. 23 

L 75 

0_26 

Pi 

-0. 01 d . 

一 0- 05 

■ - 

— 




-0. 01 d * 

一 0, 05 





同步作用 

SRD 到 IDP 

Pl 0 

-1, 58 e * 

一 0* 25 





私 Z 

IDP 到 3RD 

-158^ 

一 0* 28 





P 9 

0_09 f 

0,54 

0. 06^ 

0. 38 

0. 06 

0. 39 

pii 

0.09 f 

0.50 

( X 06 d 

0.35 

0, 07 

0. 35 

浴 （Tp)IDP (第二轮） 

ail 

0. 

28 


0.26 

i? 2 (tp)IDP 〈第 二轮） 

0. 53 

0, 

54 


0 + 55 

J? 2 (t) 3 )SRD (第三轮） 

0_ 

13 

0.30 


0,32 

/#( ¥ )SRIX 第 三轮〉 

0.54 

0. 56 


0,55 

X 2 (df) 

167.0(8) 

168,3(10) 

163.3(6) 


注：表中的系数为非标准化估计，标准化系数为带下划线的数字.除带有星 
号的系数外，所有系数都在 0. 05水平上显著 a 
a 、 b 、 c 、 d 、cn f: 系数被限定相等。 

资料来源 ：（ 美国）全国青少年调査，1976年、1977年、1978年。 
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第二列给出了移除不显著因果作用后的模型的重新估 
计情况。这个模型 （2) 嵌套在模型 （1) 中，因为除模型 （2) 中 
的色、氏、 pu 、 扣被 限定为0以外两者具有相同的参数矩阵。 

因而我们可以使用 f 值之差来检验模型 （1) 是否比模型 （2) 

拟合得更好。在这里， f 值之差为 1. 3,在模型之间的自由 
度之差为2的情况下，这是不显著的，因而相对于模型（1)， 
我们更支持模型(2)。实质上,这些作用表明 .从 IDP 到 SRD 
的同步作用比 SRD 到 IDP 的滞后作用大5 0 % . 两套作用都 
处于中等水平。 

因为不带同步交互效应的模型已经完全递归了，我们可 
以放宽前面为了识別模型而施加的相等性限制，并通过模型 

X 值的比较来检验这些限定。表 3. 2的第三列给出了这一 
估计结果，它表明在放宽相等性限定后，模型拟合水平仅仅 
提高 r 一点，估计所得系数的大小也未发生显箸的变化。但 
由于三个模型对数据的拟合都不好，模型还需要被进一步 
调整。 

上述模型的估计为我们演示了通过对模型的参数施加 
相等性限制，以佔计复杂多期数据方程组的方法以及 LI S- 
REL 和相关程序在估计各种因果作用模型时的灵活性。施 
加在三期模型参数上的限制比和外部外生变量相关的限制 
更合理，尤其是当工具变量(最初）并未被作为研究设计的一 
部分时。 

与本章讨论的面板模型相关的一个最后的警告是，估计 
所得参数应该能表明，该因果系统具有第二章所述意义上的 
“稳定性”，也就是说，该系统在未来某个时期可以达到乎衡。 
如前文已经提到的.有的模型意味着系统会在某一点上平 
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衡，有的其某些或全部的方差或协方差会无限膨胀而“爆 
炸”。尽管非稳定系统从技术上讲并非不可能•但如果所获 
得的参数估计无法使系统最终达到平衡•那通常被认为是模 
型设定错误的征兆之 一（Arminger, 1987)。例如，试想这样 
一 个简单的非递归模型和&之间交互相关，卩 xy 为X对 
Y 的影响，卩 vx 为 Y 对X的影响， R 为 Y 的误差项， l； x 为X 
的误差项。在这样一个模型中，每个变量都对其自身有间接 
影响，这样 Y 的变化会通过 Y 对X 以及 X 对V的影响，最终 
对自身形成反馈作用。将久方程代人 Y 方程就能清楚看到 
这 一 点： 

.Yt = 十 +队 [3. 9] 

如果知知大于1，那么 Y 的增加将使 Y 的方差处于无 
限增长的过程中。只有当 Pwcpxv 小于 i 时，模型才会稳定或 
者平衡，因此出现其他参数佔计都值得怀疑。在更复杂的模 
型中，要确定一个模型是否能达到妒衡更困难，需要对内生 
变量之间的相互影响矩阵 B 中进行运算。 LISREL 可以进行 
这一检验，名为“稳定性指标”，当其取值小于1时，系统可以 
达到平衡。 [1()] 
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到目前为止,本书所展示的面板模型都假定分析中所用 
变量的测量没有误差。不过，现有的测量工具，如态度调查 
或已出版的汇总统计，对社会科学中多数有意思的概念的测 
量都是不完美的，这早已得到了很好的证明。既然观察变董 
含有测量误差，那么，回归模型中结构系数的估计就有可能 
是错误的，因而研究者可能作出不正确的因果推断。测量误 
差在面板模型中的问题尤为严重，因为测量误差可使本来没 
有发生变化的变量看起来发生了变化^不过，追踪研究设计 
中对相同变量的重复测量能够提供有用的信息，以帮助我们 
推断观察项目中误差的分最，对剔除了不完美测量的污染效 
应后自变量的因果作用进行估计。 

不过，跟踪调査数据并非解决测量误差问题的万灵丹。 
所有被考虑的模型只有在其假定条件合理的前提下才是有 
效的，在很多情况下，这些假定都非常严格。只有在指标的 
数量或者观察轮次增加的情况下，它们才可被 放宽； 而在有 
些情况下，利用上一章讨论过的相等性限定，可以在 LISREL 
或相关方法屮对这些假定本身进行检验。 



第 4 萆测错误差桟型 


第1节 I 基本概念 



已有不少著作对变量测量误差的一般问题及其后果进 
行了详细的讨论 （Berry 8^ Feldman , 1985； Carmines 
Zeller , 1979； Sullivan 8^ Feldman , 1979)。 经验研究中使用 
的绝大多数指标都无法完美地测量所关心的概念，而多少含 
有一些误差。这些误差或是系统的，或是随机的。在前一种 
情况下.测量工具被认为测量了所关心的理论变量之外的其 
他 因素； 在后一种情况下，指标测量的是真实概念加上一些 
“噪音”成分。例如.在抽样调査数据中，随机噪音会因含糊 
的提问、有限的回应选项、猜想及其他在特定时点上影响受 
访者言语回应的随机因素而出现系统误差增加时，指标的 
效度会不断下降，而随机误差的增加则与指标信度的下降相 
关。此处讨论的模型将集中关注经验指标的随机误差的校 
正。有关探测和处理系统误差的更多具体内容，请看 Car ¬ 
mines Zeller ( 1979) 的著作。 

九 真实得分或称“潜变量” &在时间£ 的第々 个指 

标——的基本随机测量误差模型可以这样 表示： 

= 入 k [4. 1] 


其中，4为将力,与潜 变量％ 连接起来的非标准化系数，〜为 
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用面板败据做因果分析 


随机误差项。我们使用 LISREL 符号系统来表示变量及测 
童参数 ，以方便在本章使用这些程序估计有关模塑。在单指 
标测量模型中 ，心 被设定为1，以使指标的尺度与潜变量的相 
等。在多指标模型中，必须将一个 k 设定为1，以对潜变量 

的尺度进行设定。 [11] 对于^,通常假定其均值为0,方差在吓 
的各个水平上都相等，且与 TJ , 的结构扰动项不相关。在单指 
标情况下，如果满足这些条件，，观察指标的方差 < 将 等于： 



其中，< 为潜变量 T ), 的方差，（为％ 随机误差成分 h 的方 
差。因此，观察指标的方差由两个部分组 成:“ 真实得分”方 
差和随机误差方差。前者由潜变量 T ) ( 的方差代表。一个观 
察指标的信度~就是“真实得分”方差在指标方差中所占的 
比例 .即： 

^2 

Pyy = Z 2 ^ [ 4 - 3 ] 

气 + 

换言之，信度是真实得分方差与观察指标方差之比，其值越 
接近于〗，该潜在概念的指标所含的随机误差就越小。 

如果 k 未被设定为 1( 多指标及标准化测量模型中就是 
这样），那么一个指标的信 度为： 



如果带有随机测量:误差的指标被用于回归方程的自变 
量，那么所得结果将是潜变 ft 真实因果作用的有偏估计，因 
为町以证明自变量不再与估计方程的扰动项无关 （Markin 
1979:55) 在双变量回归模型中，估计系数等于真实系数 



第 4 章测置误差模型 


67 


乘以指标的信度，因而信度差的测量将导致对变置效应的低 
估或使其变小 。 但在多变量模型中，偏差的方向可能为仟意 
方向，！ L 任意一个自变量存在测量误差，都可能造成模型中 
所有其他变量的效应的估计严重有偏，即便那些变量本身被 
假定没有测量误差。 

从某些方面来看，测量误差问题在跟踪调查情境下甚至 
更严重。正如本书已经表明的那样，绝大多数面板模型都是 
条件变化模型或稳定得分模型的变种，其中， K 是 i 及某 
些自变量 X ,、 X ,- : 等的函数。在第2章中我们已经注意到， 
滞后内生变量在这些模型中充当了几个角 色:作 为系统 
向均衡点运动时 ，“向 均值回归”及“负反馈效应”的控制项； 
作为被遗漏因果路径的代理 之一; 影响的一个实际变量。 
遗漏通常会导致参数估计偏差，因为和 AY 之间很 
可能存在负相关，但如果含有如方程 4. 1所示的测量误 
差，而且 k = 1,那么 b 之间互不相关且与真实得分 rj , 无 
关。这是可以证明的，只要误差方差在各个时点相等： 

CovCY ；-] , AY ) = CovCT) f -i * Atj) — Var ( e,-i ) [4. 5] 

也就是说，观察的 K —及 其后续变化间的协方差等于 f 一 1 时 
的“真实得分”与“真实后续变化”之间的协方差减去1-^的 
测量误差方差。这个方程意味着，除非兄-:中的测量误差被 
控制，否则迄今所分析的条件变化模型都将导致兄-,与其后 
续变化之间的协方差过于负向的估计，低估^^对兄的作 
用(相对于“真实得分 ”7)^ 对 T ], 的作用 h 这反过来通常会导 
致高估其他变量对 I 的因果作用，因为它们与观察的 
正向相关。相反.如果 Y 的测量误差在各个时点间相关且未 
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用面板数 据做因 果分析 


被考虑，这将导致对对兄作用的高估，并相应地低估其 
他变量的影响。因此，滞后外生变量的测 M 误差是妨碍在面 
板模型下成功进行因果推论的最严重的障碍之一，因而在估 
计结构效应时，建立将测量误差纳人的模型非常重要。 

尽管测量误差在面板分析中会带来严重的问题.但仍比 
截面数据情况下处理起来容易得多。在截面数据中，有两种 
程序通常被用来处理测量误差的问题^ 一是工具变量法或 
者两阶段最小二乘估计，与上一章为结构方程模型讨论过的 
程序相似„山于存在测量误差时， OLS 估计中的偏差是由自 
变量与方程误差项之间的相关造成的，所以一个可能的解决 
方法是在模型中纳人一个与真实得分或潜变量相关，但与其 
随机误差项无关的外生变童（在定义上，就与结构性扰动项 
无关 ）（Berry 8*. Feldman ， 1985：34—.37)。 

对于面板数据，还存在其他处理测量误差的策略，而且 
多数情况下比工具变量法或两阶段最小二乘法好。由于找 
到合适的工具变量很难，尤其是在二次分析中，两阶段法依 
赖于在特定模型中可能并不成立的关于工具变量与扰动项 
之间无关的假定，且可能带有误差的自变量与其工具变量之 
间的低相关常常会导致第二阶段的估计很不精确。另外，尽 
管工具变 M 法在理想情况下能够为将模型中的潜变量连接 
起来的结构参数提供-致的估计.但它也无法提供与指标的 
信度、误差方差或其他测量特性等相关的直接信息，而这些 
往往是经验研究的重要固标。因此，工具变量法给面板分析 
带来了一些不足。 

另一个发展出来以应对测 M 误差的方法是多指标法，这 
种方法使用同一个潜变量的多个测量，同时产生对特定模型 
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中的结构效应和测量参数的估计 （Sullivan & Feldman , 
1979)。在面板调查设计中，于不同时间对同一指标的重复 
测量大大增强了这一方法的效力，因为额外轮次的数据为有 
关结构系数及测量系数的估计提供了更多信息。事实上.只 
要至少有三轮数据,就能估计出每个潜变量只有一个指标的 
模型的测量特性及结构效应，因而所有多期面板模型都可被 
当做多指标法的变种。但是，这种方法的全部效力体现在多 
指标、多轮测量模型中，在有些情况下，它甚至可能估计不同 
时点的测量误差之间及结构性扰动项之间相关的模型。这 
样的分析能够提供每个指标项的信度、潜变量的稳定性以及 
因果模型中，将潜变量连接起来的结构效应等方面的最全面 
的信息。 
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用面板数据做因果分析 


第2节 I 单指标模型 



二期模型 


当只有二期数据可得时，用来处理单指标％的测量误差 
的选择有限。为便利起见，这里遵循的是 LISREL 类型的标 
记法，如果令为潜 变量％ 在时间 f 上的观察指标 a 为^ 
在时间£上的误差方差，^为将1时刻与 f 时刻的潜变量 
联系起来的稳定性系数，; U 为外生变量自对 T ), 的效应，匕为 
潜变量的结构扰动项，我们可以将关心的结构模型表 达为： 

TJ, = pl T),-1 + y] + C [4.6] 

不过，使用并非完美测量的观察变量和 M 意味着，估计 
模型不仅含有真实得分7]，也含有测量 误差： 

( t }« t ,) = pi ( t),-i 十 e*-i ) 十 XI 7*5* 十 C [4. 7_ 

从这一方程中，我们可以清楚地看到模型无法识别，因为即 
便我们假定两个指标的测量误差的方差相等，也无法分离观 
察变量中真实得分和误差各自所占的比例。 

McAdam S (1986) 指出了儿种通过给方程中的参数施加 
额外限制，以便在 LISREL 中估计这一模型的备选方法。分 
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析者可以将卩，的取值限定为〖，这样，模型就被简化为第2 
章中讨论的无条件变化一得分模型的一个变种，其中 A ： y 由 
一系列 X 变量进行预测。另一种可能的方法是限定 I ；的取 
值，从而设定方程屮总共被解释掉的方差。最后，可以限定 
1，将> 的信度设定为某个已知值或假定值。 

对于二期数据，这些方法可被当做解释工具，用来产生 
对方程4, 7中参数的一系列估计.而且通过评估这些结果， 
分析者可以获得从对模型的不同限定中呈现出来的对潜在 
因果过程的描述，或得到方程参数的可能取值范围的估计。 
但识別模型所必需的限定存在-些问题。将卩，限定为1忽 
略了所有来自 M 而非测量误差对^的影响，而限定&或 I 
的方差常常也是站不住脚的，因为我们并不能事先知道方程 
的总体误差方差或观察指标的误差方差分量的网能值。显 
然.我们希望能在没有这些限定的情况下对值以及和 e , 
的方差进行估计，而这使更多轮次的信息成为必要。 

三期模型 

分析一个潜变量只有一个指标的模型，被 W i 1 ey 等人 
(1970〉以及 Hd S e ( l %9> 发展并用亍三期数据 s 三期模型一 

般以图表方式呈现，如图 4. 1所示， 

^ 





图 4.1 三期数据单指标测置模型 
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用面板数据做因果分析 


将指标和它们的潜变量联系起来的测量方程可以 写为： 

3^1 = 入 11 TJi + El 

yi ~ k % H - £2 [4.8] 

災 = k % + 句 

其中 ，&为 连接每个指标 y 与其对应潜变量 rj 的系数。刻画 
潜变量(内生变量)之间的因果联系的结构方 程为： 

T]i = 

% = P2 ! V 十5 _4. 9] 

T)3 = p32 T)2 + G 

对于测量误差和结构扰动项的一套标准假定是4与> 
之间、与之间的协方差都等于0。另外，测量误差被假定 
服从均值为0、方差稳定且是不同时点间彼此互不相关的随 
机分布。扰动项^同样被假定是随机的、均值为0、方差稳 
定且不同时点间互不相关。 

现在这一模型的参数尚不能被识别。因为有11个“未 
知”或自由参数 ( 3个£,、3个、3 个匕 方差以及2个 (3 系 
数），但只有6个“已知的”观察变量的方差和协方差值，没有 
足够的信息用以获得对这些参数的唯一估计。因此，我们还 
需要作出额外的假定，向模型参数施加某些限定。 

在 Heise 法中，模型的识别是通过同时标准化潜变量和 
观察指标，并限制指标^的信度在三个时期相等的方式达到 
的。通过将模型标准化， rj , 的方差等于1,这意味着模型结构 
部分的自由参数只有稳定性系数知和％。因为观察到的指 
标同样被标准化了，模型测童部分仅有的自由参数是 h ，因 
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为 e, 的方差必定等于 1—XL [13：1 根据方程 4. 4 可以推断出指 

标的信度就是 M ， 因为％的方差和方程 4.4 的分母都等于 
1。使信度在各轮调查之间相等，亦即 L 都相等，得到的是- 
个恰好可识别的模型，其中有三个自由参数和三个用以估计 
它们的观察指标间的相关系数。就观察到的相关系数而言， 
解出这三个参数就很 简单： 

、一 PnzTn 

^ ^ [4. 10] 

r n 

fi =以 
P32 > 12 

^的信度就是方程 4. 10第一个表达式的平方，因为 X 2 等于 y 
的方差中被潜变量^‘解释掉”的部分。 

Wiley-Wiley 法是通过限定指标的误差方差在各时期相 

等，也就是说 < 〖，在此过程中得到两个自由度，使 

模型在非标准化形式下得到识别。在非标准化模型中，由于 
T ], 的方差不再被限定为1，所以不可观察的％变量的刻度尚 
未被确定的问题是通过使每个；^都等于1来解决的。在这 
些假定条件下，以如下方式对观察变量的方差及协方差进行 
代数运算，即可得到各参数的估计。将三个潜变量方程 4.9 
的结构方程预测值代人测量方程 4. 8,得到如下 结果： 

3^1 =匕十 e 


yz = 氏 ]& + 1 e [4-11] 

3^3 = 03 2 (Pa i 十 t U + & 
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取这些 3 ^的方差和协方差的期望值， 得到： 

Var(yi ) = Var (。） 十 Var ( e ) 

= pg ] Var (^ j ) 

CovC ^^)= 氐 i 知 Var%) 

VaKjfe) = j^! VarC^i) I Var(^) + Var(e) 

Cov ( y 2 y 3 ) = P32M1 Var (^ ) + Var (^)] 

Var ( y ^)= 豸 2 [尾 Var(0 ) + Var (^ )] + Var (( ) + Var ( e ) 

[4.12] 

可以看到，模型恰好 《 f 识别，带有六个自由参数（三个 & 的方 
差 ，知、 知及 E 的方差)和六个用来估计这些参数的方差和协 
方差观察值。求解 e 的方差及两个稳定系数， 得到： 

VarCe) = Var(^)- gov(^^3,)Cov(^^ 2 ) 

Lov(yjy 3 ) 


a = Cov(y,y 2 ) 

㈣ —Var(^)-Vax(£) 


[4, 13] 


d = CovCy ： y 3 ) 

㈡ 32 Cov(^ y 2 ) 

一旦得到这些估计，根据方程 4 . 3 计算各个指标的信度就非 

常简单了。因为在这一正好识别的模型中， Va r ( Tj ,) 恰好等 
于 V ar (： y ,) — Var ( e )， 所以每个指标的信度即 [ Var (^) - 
Var ( e ：)]/ Var ( 3v ) 。 


在 LISREL 中整合单指标测量模型和结构模型 


至此，所讨论的模型的系数都可以通过 IJSREL 中的最 
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大似然法获得。尽管在这种恰好识别的情况下，所得的参 
数估计将与上面描述的完全一样，但 LISREL 能够提供最大 
似然标准误，这用其他方法是很难估计的，而且这一方法 
很容易被扩展，以估计四期或期次更长的单指标模型，或 
者潜变量带多个指标的模型的参数。 LISREL 还可以用来 
对上两章描述过的更复杂的结构模型情景下的测量误差 
进行建模，而且，如果这样的模型过度识别， LISREL 不仅 
能提供对所有参数的高效估计，还能提供对模型拟合优度 
的检验。 

我们将通过估计第3章的政党认同与候选人评价模型的 
测量及结构参数来说明这些方法。所得结果呈现在表1中。 


表 4.1 带测置误差的三期模型 



模型 （1) 

模型 （2) 

误差方差 



0 t (政党 认同》 

0,55 

0,55 

0,( 候选人评价） 

稳定性 

225. 7 

225.8 

PIDi -FID 2 

1,02 

1,01* 


0. 98 

0, 98 

PIIVPID 3 

1.01 

1.01* 


1.00 

1*01 

THERM r THERM 2 

0.98 

0.85 b 


0,87 

0,78 

THERM^-THERMs 

0, 90 

0. 85 b 

交叉一滞后作用 

0, 84 

0,79 

PIDi -THERM? 


28* 2 C 

0,15 

PIIVTHERM; 


28. 2 C 

a 15 
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用面板數掮 «1 困果分析 


续表 

模型<1> 模型 (2) 


THERM ! PIDs 


0 ,001 d 



0.01 

THERMz-PIDs 


0 ,001 d 



0 * 01 

值度 



PIDi 

0.86 

0*86 

PIDfe 

0.87 

0.87 

PIG 

0.87 

0.87 

THERMi 

0.81 

0 * 31 

therm 2 

0. 84 

0*84 

THERMa 

0 . 85 

0 * 85 

\ Hdf ) 

0 . 0(0) 

12.7(7) 


注:表中_数字为最大似然估计值。带下划线的为标准化系数不带星号 
酌系数都在统计上显著 # 

所有模型的 N 都是733, 
a 、 b 、 c 、 d s 系数被限定必须相等 e 
资料来源 :美国 全国选举研究，主要面板文件，1980年。 

表格第二列包含的是政党认同和候选人评分变量的测 
量误差及真实得分历时稳定性的分离 WUey-Wiley 法 （ sepa¬ 
rate Wiley-Wiley) 估计结果。如果在 LISREL 中设定这些模 

型，那么连接潜变量的，系数为 B 矩阵的非对角元素，代表 
结构扰动项的系数为 W 矩阵的对角元素，而将潜变量及其观 
察指标连接起 来的& 系数是 A ， 矩阵的主对角元素，最后测 
量误差方差为的主对角元素。 X ,被设定等于1，而 0 t 被限 
定在各轮谪査中 相等- 估计得到政党认同量表的误差方差 
为 0. 55, 而政党认同真实得分的标准化稳定性从第一轮到第 
二轮调查为 0, 98, 从第二轮到第三轮为 1. 0 。 与观察得到的 
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第一'轮、第二轮之间的相关 0. 87，第二轮、第三轮之间的相关 
0. 88相比，这一估计表明，校正指标的测量误差后，真实得分 
的稳定性近乎完美。通过方程 4. 3给出的公式计算得到量 
表的信度,在第一轮中为 0. 86,第二轮中为 0. 87,第三轮中 
为 0.87, 候选人评价变量的对应结果为，估计的误差方差 
225. 5,校正的稳定性估计 0. 88、 0. 89,而估计的信度在第一 
轮调査中为 0. 81，第二轮为 0. 84,第三轮为 0. 85, 

这些方法能以几种方式用于变量间还含有结构效应的模 
型。方法之一是将指标的误差方差固定为 WileyWiley 初始 
估计所得值，然后将这一信息加给前面两章估计过的任意一 
个模型，就能对结构效应进行估计》或者，只要所有参数都可 
识别， LISREL _能同时给出对测量误差和结构系数的估计。 
作为这一方法的例子，表 4. 1的第三列给出了第3章的三期交 
叉滞后交互作用全模型的重新估计结果。模型显示,仅政党 
认同对候选人评分存在显著影响，这和前面假定不存在测量 
误差的模型估计得到的交互作用形成了对比，政党认同及候 
选人评价的误差方差估计结果在统计上显著。此外，模型对于 

数据的拟合非常 好在七 个自由度下， f 为 12. 5,这意味着该模 
型在总体中无法被拒绝 (P > 0. 05)。上述模型证明，一旦测量 
误差得到考虑，从面板模型中得到的因果作用可能非常不同，从 
而引导研究者在变童的实际关系上作出不同的结论。 

四期或更长的单指标模型 

WilerWiley 模型及 Heise 模型在三期面板数据下，对估 
计指标的测量特性和结构效应非常有用。不过，这些模型中 
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的假定和限制有时很难成立。具体来讲， Heise 模型中信度 
相等的假定以及 WUerWiley 模型中误差方差相等的假定尤 
其成问题，因为并没有先验的理由支持潜变量的方差（出现 
在信度的计算中），或者误差方差将在不同时期保持不 
变。 [14 -事实上， Jagodzinski、Kiihnei 和 Schmidt (1987) 表明, 

在很多情况下，指标的误差方差会随着时间的推移而逐渐变 
小，从他们的观点来看，这能够解释为什么“ WUey - Wiky 以 
及 Heise 提出的模型……常常在调査间隔短的跟踪研究中 
失败 ”(1987:294—295), 

另外，由于模型恰好被识别(如果未纳入其他内生或外 
生变量），因而无法对模型的整体损合水平进行检验，因为它 
们都能完美地说明观察数据。在有些情况下，不合情理的经 
验结果(如在 Wiley - Wiley 法中出现负的误差方差估计，或者 
在两种方法下信度或标准化稳定性系数的估计明显大于 1) 
是模型不适用的迹象。但无法确定究竟是测量模型设定错 
误，还是结构模型设定错误。 

最后，有关测量误差不相关的假定也是有问题的，因为除 
了与潜变量有关系外，相同题项可能在不同时期间存在某些 
共变。调查中出现测量误差相关的原因,包括记忆效应、题项 
措辞或意义相似而导致的不同时期的回应相似、潜变量(该题 
项正是其指标)产生的因果影响的独立性等。忽略误差相关的 
实际后果是极有可能夸大真实得分的稳定性，因为由测量误差 
相关造成的真实得分稳定性也被合并到了估计的 P 参数中。 

更多轮次调査信息的加人会使单指标测量模型的估计 
和评价变得容易一些(实际运用见 Feldman , 1989; Green 

Palmquist , 1990)。其优势之一是，调査轮次更多的模型的 
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某些参数可能会过度识别。在这种情况下，模型整体拟合的 
检验可以通过利用代数方式分别计算出过度识别参数，然后 
比较其取值的方式进行，也可以利用 LISREL 获得参数的最 

大似然估计，并使用 X 2 拟合优度检验来评估模型对观察指 
标的方差和协方差的解释程度。 Werts 、 JSreskog 和 Linn 
(1971) 扩展了图 4. 1中的 Wiley - Wiley 模型以用于四期数 
据，并表明“处于中间的”指标 M 和％的误差方差和真实得分 
方差(进而信度)能够被识别，而从时间2到时间3的潜变量 
的稳定性知的估计被过度识别^如果用观察的相关系数表 
/Pn > p32 ~ ^*13^*24/^12^34 及岛 2 = ^14^23/ ^12^*54 o 如果调查轮次更 
多，将会有更多的参数被过度识别。 

期数更多的面板分析的第二个优势为，额外信息允许对 
带有相关的误差的模型进行更高效的检验，并大大提高将此 
类模型与带随机误差的模型进行比较的能力 。 WilerWiley 
(1974) 提出了针对三期面板的测量误差相关的模型，但这种 
正好识别的模型常常会得到反常结果，如误差方差和协方差 
为负、不合理的稳定性估计等。对于四期数据，假定其稳定 
性相等、误差方差相等及误差协方差相等的模型是带3个自 
由度 (10 个观察的方差和协方差减去7个自由参数——4个 
扰动项方差扣1个卩、1个误差方差和1个误差协方差 > 的过 
度识别模型。不过， Palmquist 和 Green (1989) 表明，来自这 

一模型的估计在指标信度及真实得分稳定性较低的情况下， 
相对缺乏效率。另外，他们注意到，随着调査轮次的增加，稳 
定性、误差方差及误差协方差相等的可能性将显著下降但 

四期数据仍提供了显著的优势，能通过/拟合优度测量及 
对参数估计可能性的检査来对各种替代模型进行评估。 
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当一个潜变量有多个指标可用时 * 单指标测量模型的很 
多局限都能被突破。如果存在两个指标，有些限制性模型依靠 
两轮测量就可以被估计。可得的指标及调査期次越多，包含历 
时相关测量误差的过度识别模型也就越可能被估计，并可通过 
整体的拟合优度统计进行检验。職者也可能给模型的参数施 
加各种限定，然后通过放宽这些限定并比较各替代模型的概要 

性/拥量的方式来检验这些 限定。 通过这些方式，多指标法在 
估计和 m ^ ssi 量模型上，能够離大得多的灵活性和航 

二期双指标模型 

对迄今讨论过的模型的最简单扩展是给潜 变量， 增加 
另外一个指标3^ «■ 增加这一指标可以使图 4. 2所示的测量 
模型仅需二期数据就能被估计出来。 

在这一模型中， y , 和分别为潜变量 ij 在时间1和时间 
2上的同一个指标和广是 卩在每 轮调査中的第二个指 
标。滞后潜变量被设定对其第二轮取值存在影响》我们对 
这一模型作出了如下初始假定: ( 1 ) 所有变量、误差项及结构 
扰动项都被表达为离均差形式; （2) 误差项 &和匕 服从正态 
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图 4.2 二期双指标嬲 fll 模型 

分布;（3)$、 Tji (与匕不相关； (4) ij ! 与& 无关; （5) 不同时点 
的 C 互不相关; (6) 测量误差项之间互不相关。潜变量尺度 
的设定是通过将 K 和 K 的系数固定为 1( 当然，也可以对 ir 2 
和 I 这么操作)完成的。 

模型有 9 个自由参数需要估计和&的方差、知、 U 、 
^2 以及4个误差方差），观察指标的10个观察的方差和协方 
差使最终还剩1个自由度可用对模型进行检验。只要通过 
LISREL 或相关方法得到这些估计值，就可如上面的方程 4. 4 
一 样计算出各个指标的信度。 

除了只需二期数据就可得到估计外，这一模型还有几个 
令人满意的特征。第一，研究者可以采取不同的限定方式以 
检验各指标的测量特性，而且每一个限定都能得到检验其适 
用性所必需的自由度。在心理测量学中，如果 X „ =；^且 
0, =0 % ，那兄和 K 被称为的平行测量”。这在 LISREL 
中可以通过将两组 X 系数设定为1，且令每个时点内的两个误 
差方差相等的方式进行检验。由此增加的四个自由度可以用 
来检验这些限定的适用性《或者，如果 X „ =心，但误差方差 
互不相等，那么 K 和 K 就是 iji 的 tau 相等测量。这只需要令 
两个 X 系数都等于1,就能得到检验，结果得到两个自由度。 
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在图 4. 2的模型中，这种测量被称为“同源的测量”，连接指标 
与潜变量的系数互不相同，指标的误差方差也是 如此。 

通过令同一个指标在不同时点的误差方差相等 (即 之= 
0*3) 或同一个指标在不同时间的 X 系数相等(即 k = X 12 ) ， 
还可以对模型施加更多的限定，这些限定都可以用模型相对 
拟合的方式进行检验。后面这个令同一个指标的 X 在所有 
时期相等的限定，在面板模型中尤其重要，这相当于假定一 
个非标准化潜变量在每轮调査中，对某个指标的非标准化作 
用相同。 Wheaton 等人 (1977:129) 断言，这一假定是下面这 

种模型的关键要素，这种模型“标榜要解释(潜)变量的稳定 
性，这意昧着我们指望能(在不同时间)测量同一个概念。严 
格地讲，稳定性这一概念需要这一设定”。因此，限定 X 在不 
同时间相等的假定通常都会出现，对这些假定的检验在 LI &- 

HEL 或相关方法中通过/差异检验，将对应模型与非限制 
模型进行比较即可实现。 

双指标二期模型的主要不足在于，它没有在不同时间测 
量的相同题项之间设定相关的误差。 Costn er (1969) 以及 
Sullivan 和 Feldman(1979) 发现，图 4. 2 的模型中唯 个过 

度识别的参数是稳定性参数，它有两种估计。因此模型拟合 

度的评估可通过 LISREL 的 X 2 或计算出这两个估计然后比 
较其取值的方式进行，可以对不同时间的测量误差是否存在 
相关进行检验，因为(如果误差相关是正的)模型估计的真实 
得分的稳定性将不足以解释指标在不同轮次间被观察到的 
相关。遗憾的是，一旦纳人相关的测量误差，图 4. 2中的模 
型就变得不可识别。要想估计那些参数，有三种方法可供选 
择: （1) 在二期模型中，给潜变量增加更多的指标; （2) 在二期 
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模型中至少纳人一个在两个时点都会影响潜变量的外生“背 
景”变量 K 3) 增加更多轮次的数据信息《所有这些方法都能 
在不对测量误差矩阵施加任何限制的情况下，使模型得到识 
别。第一种和第三种方法更可取，因为这样所得的模型将有 
足够的自由度向参数估计施加或放宽各种限定。第二种方 
法在额外指标或更多轮次的信息都不可得时,是必然选择。 

一^三指标二期槙型的例子 


图 4. 3展示了一个二期模型，其中合法性政治抗议倾向 
有三个指标，所用数据来自前面章节播述过的前联邦德国政 
治抗议数据可以看到，同一指标不同时期间的相关误差，由 
图中同一指标在两个不同时点间自由的误差协方差代表，也 
就是及 I 。1和\为第一轮、第二轮调査中，对参与 
“被批准的游行示威”的倾向的回应不和 Y s 为“与公民行动组 
织一起工作”的倾向， I 和 I 为“为请愿收集签名”的倾向， 



图先3含有相关的测最误差的三指标模型 


模型中有 (6 X 7)/2 或21个观察的方差和协方差，有16 
个自由参数——匕和匕的方差 、知 、‘、4、‘ 、‘、 6个 
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观察指标的误差方差以及各指标不同时期的误差项之间的3 
个协方差。潜变量的刻度通过将 x „ 、 x 12 固定为1而得到设 
定。模型共有五个自由度》表 4. 2给出了这一模型的几种 
变形的最大似然估计。 


裹 4. 2三指标二期棰型 : 含有和不含相 关的麵 量误盖 



相关误差模型 (1) 

无相关误差的模型 (2) 

澜鼉系数 

Xl ! 

1,00* 

1. 00 a 


0.68 

0, ?0 

Xsi 

1.12* 

i . 11* 


0.68 

0. 69 

Xai 

L 59* 

1.48* 


0,91 

0, 88 

hi 

L 00 4 

1.00 1 


0, 75 

D. 79 

hz 

Lll * 

L 06* 


0.77 

0.79 

Xa 3 

L 41* 

1* 30* 


0.91 

0. 89 

Bn 

3* 92* 

3. 66* 


4.85* 

4.66' 

033 

1. 69* 

2. 36* 

fl «4 

3.34* 

3.11* 

fe 

3_68* 

3. 42* 


1,80* 

2, 28* 

&41 

1.47" 


052 

0- 91* 



—0- 74* 


稳定性系数 

^21 

a 62* 

0.64* 


一 0_ 54 

0. 54 

RHip) 

0,29 

0. 29 

X 2 (dO 

12, 5(5) 

69. 8(8) 


注 r 表中的数字为非标准化最大似然估计，标准化的系数帶下划线。所有 
模型的 N 都是377。 
a- 系数被固定为 U 
* 表示在0, 05水平上显著。 


«4 章瀏量误盖模型 
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表格第二列所示结果对应图 4. 3的相关误差模型。正 
如该表所示，所有参数估计都在统计上显著，包括各个指标 
不同时间的测量误差之间的协方差(0、,、 I 、 D 。 估计的 
“签名请愿”指标( I 和 W 间的协方差为负，这一不合理的结 
果将在第5章的负自相关背景下讨论。将 X ,系数取平方即 
可得到各指标的信度，因为在完全标准化的模型中，7|和 Y 的 
方差都等于1。 [15] 在本例中*信度在 0. 5到 0. 8的范围内，表 
明观察变量中有大量的随机测量误差。潜在“合法抗议倾 
向”变量的非标准化稳定性被估计为 0. 62,标准化作用为 

0. 54„模型的拟合优度以 X 2 测量，为 12. 5,带五个自由度, 
表明模型对观察数据的拟合相对较好。 

在第三列中，估计了一个不带自由的误差协方差的模 

型，最终拟合度要差很多，在八个自由度下， X 2 值为69 .匕 
由于这一模型除了九=0^=9^ =0的限定之外，与第二列 
中的模型完全一样，因此，放宽这些限定对模型拟合度的改 

进可以通过比较两个 x 2 而得到检验。在本例中，卡方值之 
差在三个自由度下为 57. 3,因此通过允许误差项之间存在协 
方差而使模型得到的改进在统计上是显著的。不过实际上, 
误差协方差并不大，因为两个模型的非标准化稳定性相差很 
小，而在两套标准化的稳定性之间没有差异^ 

—些其他测量模型同样可以在 LISREL 框架中得到检 
验。其中一个值得推荐的模型根据 Wheaton 等人 (1997) 的 
主张，限定每个指标在第一轮调査和第二轮调査中的 X 系数 
相等,这可以保证潜变量在不同时间上的相似性0通过施加 

这一限定，模型得到两个自由度，在这种情况下, x 2 的差异为 
2. 7,在 0.05 水平上统计不显著。因而可以得出结论认为这 
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—相等性限制在这一数据中成立。其他的模型还可以限定 
相似指标在不同时点的误差方差相等，或者如果有理论依据 
怀疑指标间存在某些与潜变量不相关的共同变异，也可以设 
定让同一时点的不同指标间的误差协方差自由变化。还可 
以就总体中的不同子群体比较各个测量系数和潜变量的稳 
定性。关于群体差异的讨论，可以参阅 Jdreskog 和 Sorbom 
的著作 (1989: 第9章>，该方法的应用可以在 Judd、Krosnick 
和 Milburn(1981) 以及 Porst、Schmidt 和 Zeifang(1987) 的著 

作中找到。 

整合多指标模型和结构模型 

这种类型的测量模型可以被直接整合进更复杂的因果 
系统。我们可以设置一些模型，假定图 4. 3中的潜变量被 
一系列外生变量或内生变量所影响，这些新增变量可以带 
有误差项，也可以不带。在 LISREL 中，可以对 B、 V、 

呔矩阵进行调整，以刻画新的内生变量的测量与结构方程 
系统。如果模型中有外生变量，还需对与它们的测量模型 
对应的矩阵(&， 《*) 以及与结构效应对应的矩阵 (®, D 进 
行设定 

作为例子，我们将对二期德国抗议数据中，合法抗议倾 
向与群体资格之间的交叉滞后作用和同步因果作用进行检 
验，这一数据使用三个指标来测量抗议倾向。我们假定群 
体成员资格在第一轮、第二轮中无测量误差，由于两个时点 
都只有一个指标，这一变量可能的测量模型无法识别。因 
此，对 LISREL 的测量误差矩阵进行修正，以反映两个内生 




87 


第 4 章_量霣差模组 

变量 (GROUPS 和 GROUP$2) 得到完美的测量， GROUP 和 
PRPOTEST 潜变量的结构效应在 B 矩阵中设定，潜变量结构 
扰动项的方差和协方差在 V 矩阵中设定。回忆前面的章节 
可知，如果没有其他仅影响被关注变量之一而不影响另一个 
的外部外生变量，同时带有交叉滞后作用和同步交互效应的 
二期模型就将不可识别。因此，要估计这一模型，必须为第 
二轮调查中的合法性抗议倾向和群体成员资格分别设置一 
个工具变童。这两个外生5变量被设定只分别对两个交互 
相关的第二轮变量中的一个有影响这样的变量并不是该 
研究数据收集的一部分，但调査含有受访者潜在的非法政治 
活动参与(如参与非法游行)的倾向以及受访者自报的、鼓励 
非法抗议行为的群体成员资格等信息。如果我们假定1989 
年的非法抗议倾向会影响 PROTEST^ 但与 GROUP 2 方程的 

扰动项无关，1939年的非法成员资格会影响 GROUPS 但与 
PROTEST 2 的扰动项无关，那么这些外部变量可被当做工具 
变量以识别这一模型。这个描述两轮调査间 GROUPS 和 
PROTEST 关系的模型的最大似然估计为； 

PROTEST = 0. 45 PROSTEST^l. 13 GROUPS^ +( — 0, 20) GROUP! 


(an) 

(0.57) 

(0_ 27) 

0*41 

0.45 

—0.07 

[4.14] 


GROUPS = 0.27 GROUPS! + (-0,01)FROTEST £ +0.11 PROTEST 

(0,14) (0.05) (0,06) 

a 25 0.03 a 25 
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这些估计结果表明， GROUPS 和 PROTEST 之间的关系 
与我们在利用三期全国青少年调査数据分析同龄伙伴涉人 
与违法行为之间的关系时，看到的反馈过程相同。抗议倾向 
对第二轮调査时的群体成员资格有显著的滞后作用(在控制 
群体成员资格初始值的情况下），而群体成员资格对抗议倾 
向具有同步作 用。 

利用背景变量来识别双指标测量棋型 

在一些情况下，并不存在三个指标用以估计带有相关的 
误差项的测量模型。在这种情况下，如果至少存在一个在两 
个时点都对潜变量有影响的背景变量，那么仍有可能识别图 
4.2 中含有相关的测量误差的二期一双指标测量模型 （ Dw ¬ 
yer , 1983:400)。在 LISREL 中，可以通过将该背景变量作 
为外生$变量纳入，并在 r 矩阵中将其效应设定为自由参数 
的形式对这一模型进行设定。如果每轮调査中有一个入系 
数被设定为1，那么现在全部自由参数的总数为14: &和& 
的方差、％、4个误差方差及2个误差协方差、2个 
从背景变量到潜变量的7作用，还有1个背景变量的令方 
差。因为纳人背景变量后有15个 （5 X 6/2) 观察的方差和协 
方差，所以模型过度识别，带有一个自由度 . 

三期三指标模型 

要识别和估计含有相关的测量误差的模型的最后一个 
办法，是至少再收集一轮信息。如果一个潜变量的两个指标 
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被测量三轮，那么所有将潜变量与指标连起来的参数、潜变 
量的稳定性系数以及相邻轮次的指标的测量误差都能在没 
有限制的情况下得到估计。在这种情况下，将有21个观察 
的方差协方差、18个自由参数，因而整个模型带有三个自由 
度,可以被检验。该模型唯一的局限在于，如果没有进一步 
的限制，第一轮和第三轮指标的澍量误差间的协方差将无法 
被识别。合理的限制之一是让相邻两轮调査的测量误差的 
协方差相等，在这一假定下，连接第一轮和第三轮指标测量 
误差的协方差也可被识别6另外，还可以将各轮调査的艮值 
设定为相等,但与上面讨论过的单指标模型一样，这一限定 
欠缺合 理性. 

当潜变量的三个指标被测量的时点数达到三个甚至更 
多时，不相邻轮次的測量误差间存在相关的模型，在没有限 
定的情况下也能被估计。与调査轮次更少的数据相比，这一 

模型还允许对相关的测量误差进行更灵活的建模和解释。 
例如， J^odzinski ( 1987 ) 以及 Raffolovich 和 Bohmstedt 

(1987) 展示了带有相关的测量误差的模型是如何与经典的 
因子分析模型直接对应的，后者的每个观察变量都是下列三 
个方差的函数:公因子、纯误差方差以及具体题项因子—— 
用来测量只属于该题项的方差，这一方差既非随机测量误 
差，也和公因子无关。因此，题项因子混合了前面讨论过的 
不同时点的测量误差间的相关。在截面分析中，具体題项方 

差与特有随机误差成分是混合在一起的，因而会高估一个指 
标的纯误差成分 (Raffolovich & Bohmstedt , 1987:386), 如 

果拥有多期面板数据，要想区分具体題项的方差的三个来 
源,就可以估计图 4. 4所示的模型。 
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在这一模型中，災的每一个指标都由一个公因子(第一 
轮是潜变量叩，第二轮是％，第三轮是、一个误差项以 
及一个具体题项因子(每轮调查的第一个题项对应的是，， 
第二个对应的是 ，，第 三个对应的是引起的。模型中有 
一个 X 系数或因子负载将每个指标与实际关心的潜变量联 
系起来，另一个则在每个时点，将该指标连到题项因子上 
这一模型假定，随机误差与结构扰动项与潜变董及具体因子 
无关，且假定具体因子与公因子彼此独立。 

要设定前面在 LISREL 中估计过的简单的相关误差模 
型，只要让相邻期次的 E * 间的协方差自由变化即可。由于这 
里包含具体因子，所以 LISREL 的设定在一定程度上更复杂 
了 6 各个公因子1的刻度的设定是通过将每轮调査中的一 
个指标的系数固定为1来完成的，而具体因子的刻度同样是 
通过将某轮调査中连接具体因子和指标的系数固定为1来 
实现的。这些设定的选择是随意的，但每个潜变量一定要有 
一个指标的系数被固定为1,各个具体因子也是如此。测量 


误差方差被设定互不相关，因为具体因子上的负载已经把 I 
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住了相同題项的历时相关6图14所展示的模型是过度识 
别的，它具有16个自由度，因此总共有9 X 10/2或者说45 
个观察的方差和协方差，而仅有29个自由参数需要估计。 


通过对某些系数施加限制，还可以对其他替代模型进行估计 
和比较。例如，不含具体题项因子的模型、公因子与其各指标 
之间的因子负载在不同时间相等的模型、具体因子与其各指 
标之间的因子负载在不同时期相同的模型都可以被检验和互 
相比较。只要这些模型相互嵌套，也就是谈，模型所含变量相 
同而只是在 A 或 61 矩阵上的限制多出一个或几个，那就可以 

通过两个模 型的/ 之差对模型拟合的提高程度进行评估。 


只要得到估计结果，就可能将每个指标的方差分解为共 
同部分、具体部分及纯随机误差部分。 Raffolovich 和 Bohmst - 
edt (1987) 表明，当所有潜变量(包括各具体因子)都被标准化 
成均值为0、方差为1时，每个指标的总方差可以被估 计为： 


a 2 Cy ) — + 0 e [4.15] 

其中， c 表示公因子， s 为具体因子 D 因此，要计算公因子、具 
体因子以及纯误差方差各占题项方差总和的比例，就非常简 
单了。 

最后，这些模型中的测量效应与本章讨论的所有模型一 
样，也可以放在被充分设定了的结构方程模型中进行估计。 
这一方法的优点是，潜变量稳定性的估计偏差将会降低，而 
且这些差异也可能影响测量误差的估计。另外，在很多分析 
中,校正测量误差是为了获得对潜变量之间因果作用的无偏 
估计，而同时对测量误差及结构效应进行设定，则能更好地 
实现这一目标。 





■ 
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用 瞿板歙据 ttH 果分析 


在前面的章节中，我们已经描述了通过估计带有各种时 
滞结构和变量测量误差的面板模型来强化因果推论的不同 
方法。不过，跟踪调查情境下的因果推论的成功不仅取决于 
准确设置的合适时滞结构以及对测量误差的矫正，还需控制 
那些对因果系统存在潜在污染效应的外部不可测量变量。 
不可测量变量是内生变量的结构扰动项出现自相关的主要 
原因，忽视这一因素将导致许多稳定得分面板模型中因果作 
用的 OLS 估计有偏。这个问题很普遍，但面板数据常常含有 
足够的信息对自相关进行控制，也能对变量间其他可能的虚 
假相关类型进行检验 a 虚假相关面板模型直接建立在前一 
章讨论过的测量模型基础上 a 

请认真回想一下我们使用“全国青少年调査”探讨过的 
违法同龄伙伴涉人程度 ODP ) 与自报违法行为 ( SRD ) 两个变 
量之间的关系在第 3 章中，我们看到面板数据是如何有助 
于估计这两个变量间可能的交互作用的。不过，可能为真的 
另一个替代模型是，事实上 IDP 和 SRD 测量的并非完全不 
同的概念，相反，它们可能都是一个更一般的公因子的具体 
指标，如个体在不法行为方面的总行为倾向 （Goufredson 
Hirschi, 1987), 在这种模型中，公因子“ 导致， ’受访者对两 
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个变量的反应，而 1 DP 和 SRD 量表之间的所有共变都能被 
它们与这一公因子的相关所解释.尽管依靠截面数据，我们 
无法排除公因子模型，但是在面板数据中，公因子模型是可 
以估计的，并且能与变量间存在直接因果作用的模型进行 
比较。 

在另一些情况下，公因子模型能在理论基础上被排除。 
例如，我们有很好的理由假定对候选人的评价与个体的政党 
认同并非某个一般性概念的指标，关于两个概念理论上的差 
异，已经有很好的论述了。但虚假相关的问题仍然存在，因 
为未被纳入模型的其他变量仍然可能对因果系统产生影响。 
这些变量并非政党认同和对候选人的评价所测量的概念的 
“潜在”变量，而是在数据收集时遗漏了的或者研究者根本未 
加以考虑的代表其他不同因素的变量。这些变量可能是背 
景性的社会或人口学的特征，例如之前服兵役的情况、之前 
的选举行为或者是对总统竞选表现的评价等态度因素，它们 
能够同时影响政党认同和对竞争候选人的评价。在截面研 
究中，这些变量都被归人内生变量的误差项，就这一点而言, 
不可测量变量与政党同和候选人评分都有关，因此，连接 
这些变量的系数的估计将有偏。在跟踪调査中，这个问题会 
因不可测量变量存在一定的历时稳定性而更加复杂。在这 
种情况下，内生变量的结构扰动项会呈现自相关，模型参数 
的 OLS 估计也会不正确在稳定得分面板模型中，不可测量 
变量会导致对滞后的 Y 的作用怙计有偏, X 对 Y 的作用的估 
计同样可能受其影响而出现偏差。 

本章将介绍一些利用面板数据估计公因子和不可测量 
变量模型的可选方法。这些模型无法提供控制变量间虚假 
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相关的万无一失的方法，它们都有着各自的前提假定，这些 
假定在一定的研究环境中可能成立，也可能不成立。尽管这 
些方法不会也不能产生实验设计所能提供的因果推论信心, 
但在提高非实验情境下的因果推论的质量上,它们确实提供 
了我们需要的帮助^ 
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第1节 I 公 H 子模型 


二期双变量公因子的一般模型如图 5. 1所示。在该模 
型中，; C 对 Y 或 Y 对 X 都没有因果作用，观察到的两个变量 
间的协方差，是它们与公因子 Z 在每个时点上的联合关系的 
函数。变量 X 和 y 都还被一个假定与 Z 不相关的随机测量 
误差项 A 所影响。显而易见的是，该模型与第4章描述的双 
指标二期模型完全相同，图中的虚线表示 X 和 y 的测量误差 
可能历时相关。该模型中需要估计的结构效应是包括公因 
子 Z 在时点1和时点2 上对石 和和: b ) 的作用、 Z 对 
I 和和心）的作用以及 z 的稳定性(卩山为了便于表 
述， X 、 Y 和 Z 被假定为标准化 变量。 对图 5.1 中的结构效 
应和测量误差作出不同假定而得到的各种虚假公因子模型， 
都可以用数据进行检验。 



困 5.1 二期双变置公因子模型 
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两个带限制的公因子模型的检验可以直接通过比较具 
体观察相关系数的大小来进行。如果能够假定 Z 对叉,_和1 
的因果作用在不同轮次中相等，也就是说，& = &且心= 
h ，并 且不与 、 Y \ 与 Y 2 之间不存在测量误差相关，那么 
模型预测结果中兄与 y 2 、 K 与 X ,的交叉滞后相关将相等 
( Kenny , 1973)。正如第3章提到的，比较交叉滞后相关已 
不被认为是评估变量间因果优先次序的方法 （ Duncan , 
1969; Rogosa , 1979 } Shingles , 1976) ,但它检验这种特定的 

(尽管是限制性的)虚假模型的作用仍然存在。当不存在相 
关的测量误差，且 Z 对它的指标 X 和 Y 在不同调査轮次中 
的作用不相等时，对应的模型检验将 变成： 

KXMKY . Yi ) = riX ^ r ^ Y ,) [5,1] 


也就是说，取决于尤和 Y 的历时稳定相关系数的乘积是否等 
于交叉滞后相关的乘积。 

然而，这些检验常常是不完全的，因为它强行假定了调 
査轮次之间的测量误差相关。允许误差相关可能性的公因 
子模型可以在 LISREL 及相关框架里进行设定和检验，方法 
与前一章讨论的二期双变量测量模型一样。“全国青少年调 
査”第一轮和苐二轮的数据中，违法同龄伙伴涉人程度 ODP ) 
与自报违法行为 ( SRD ) 之间的关系可以用来说明这些方法。 

不含相关误差模型的 USREL 初始估计显示，它无法解释 
SRD 和 IDP 之间被观察到的历时相关。该模型强 令乙对 
SRD 和 1 DP 的结构效应在不同时期相等，从而导致对数据的 

拟合非常差，三个自由度下的 f 值为 161. 3。放宽相等性限定 

后，模型大为改善，结果为一^自由度下的 f 值等于 138. 5。/ 
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值之差 22. 8在两个自由度下统计上非常显著，不过这一结 
果表明，模型的整体拟合度依旧很差。因此,在解释 NYS 数 
据中 SRD 和 IDP 的关系上，这两个限制模型都可能被拒绝。 

不幸的是,含相关的测量误差的公因子模型是无法识别 
的，估计结构参数需要更多信息。一种办法在第4章中已讨 
论过，即增加一轮观察,所得的三期双变量模型将有足够的 
相关系数 (15) 用于结构参数的估计。然而，正如我们已经知 
道的，仅相邻轮次变量的测量误差相关的模型能在无限制的 
情况下得到识别。要估计第一轮和第三轮变量间的误差相 
关，更多指标或者对特定参数的相等性限定成为必要 9 不 
过，当只有两轮数据可用时，添加背景变量也能达到在无限 
制的情况下识别全部结构参数和测量误差相关的目的 8 该 
模型是过度识别的，带有一个可用以对模型的拟合度进行检 
验的自 由度。 

在当前的例子中，年龄作为观察的背景变量被纳人模 
型，可以重新对 IDP : 和 IDP 2 之间以及 Sm 和 SRU 之间含 
有相关误差的模型进行估计。该模型比先前两种设定的模 

型的描合度更好，一个自由度下的 f 是 4. 9。尽管如此，这 
—拟合优度还不足以支持该模型在总体中成立。相比之下， 
依照先前发现的反馈过程(第二轮中的 IDP 对 SRD 具有同 
步作用，第一轮 SRD 对第二轮 IDP 具有交叉滞后作用)设定 
的 IDP 和 SRD 因果作用模型对数据的拟合极好，并且显示 
IDP 和 SRD 之间的因果作用显著。在这个例子中，对虚假公 
因子模型的拒绝增强了我们对含有直接因果作用的模型适 
用性的信心^ 

当公因子模型未被拒绝时，它的估计系数的解释与第4 
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章的测量模型中的完全一样。 4 对 X , 和1 的作用代表了 
这些指标对公因子的负载，氏代表公因子的历时稳定性。在 
加人了背景变量的模型中，7系数代表背景变量对公因子的 
作用，而观察变量测量误差之间的相关代表 X 或 Y 的与公因 
子无关的具体题项的历时变化。 

不过，和在前面几章中一样，需要强调的是，如果参数估 
计结果不合理或所表示的实际关系在理论上站不住脚，那么 
绝对不能仅仅根据统计结果而接受模型。在估计过程中应 
时刻注意模型背后的假定以及给定情境下，这些假定是否合 
理。如果模型并不拟合数据或在理论上不可接受，那么应该 
对其他替代模型，包括那些含有直接因果作用的模型，进行 
检验和比较。 
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2节 I 不可测董变置模型 




二 : m. 






变量的虚假相关除了因为它们与同一个公因子有联合 
关系外，还可能是另一个过程造成的 & 叉和^可能因为在既 
定模麵中遗漏了理论上迥异的不可澜量变量而出现 相关。 
但如果关于这些不可测量变量的形式的某些假定能被证实， 
那么将不可测量变量的污染效应剔除后,面板数据就能用来 
估计所关注变量间的直接因果作用. 

假定解释某个因变量兄的真实模 型为： 

兄=决 + 沐 X + 决 Yh + Z , + e , [5, 2] 

其中，乙是研究者未知的或不能被纳人模型的不可测量变 
量^是随机扰动项不正确的估计方程 变为： 

y t =恥 + pi x; + i^y^i + u t [5.3] 

其中， 

= Z , + e , [5. 4] 

乙出现在扰动项 K , 中会产生一些重要的后果。首先，只要 
4的稳定性大于0, ^必然会历时相关，换句话说,外生变 
量 Y 的结构扰动项会出现自相关。第二，如果 Z 的稳定性不 
等于0,方程 5. 3中的 Yh 将必 然与叫 相关，因为它们都与 
乙―相关。这意味着， OLS 不再适合用来估计这一模型，因 
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为扰动项和解释变量 Y , 4之间的相关会导致方程参数估计 
的有偏和不一致 ( Johnston , 1972) ， 这通常会使 0 LS 高估 

兄- i 对 K 的真实作用，因为被遗漏变量 Z 的稳定性会导致 Y 
被观察到的稳定性中有一部分是虡假的 ■> 第三 ，一旦 被遗漏 
变量乙还与足相关，那么新的偏差还会出现在对方程 5. 3 
的译 的估计中 。 在这种情况下，方程 5. 3 中足对 I 的作用 
至少是部分虚假的，因为它们 都与乙 相关，偏差严重程度取 
决于 z 与这两个观测变量的相关强度。 

与拥有大量历时性观察值的时间序列分析不同，在仅有 
少数几轮观察的短期面板研究中，校正因被遗漏变量而造成 
的偏差非常困难。当内生时滞变量作为预测变量时，这神问 
题最为严重，因为因果模型需要同时设定 Yh 对 Y , 和 am 对 
W 的作用。显然，最好的方法是尽可能充分地设定实质性模 
型，这样一来，给定方程的误差项会相对较小，由被遗漏变量 
所引发的误差相关的危害也会降低。但设计局限往往会使 
这种策略不太可行，剰下的模型估计选择还有几种。 

首先，可以将以外部观察变量形式出现的额外信息纳人 
模型，方程 5. 3 的参数可能通过类似工具变量的估计方法得 
到复原。第二，可以对被遗漏变量 Z 的稳定性作出不同假 
定，从而使结构扰动项之间的协方差以某种可预见的形式出 
现。通过在多轮面板分析中对扰动项的协方差施以限定，并 
在 LISREL 或类似的程序中估计模型，方程 5. 3的参数是有 
可能获取的。第三，可以在 LISREL 框架中对更多不可测量 
变量进行明确设定，并且如果信息——观察到的相关 ^^-充 
足，包含 X 对 V 的结构效应以及 Z 对每个变量的 M 时效应 
等在内的各种模型就都可以得到估计。我们将用本书已经 
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分析过的经验案例来对这些方法逐个进行说明。 

工具变量法 

解决方程 5. 3中误差自相关问题的方法之一是使用工 
具变量提供额外信息，但它需要满足前几章已经提过的条 
件: （1) 与兄-:相关，但是 不与叫 相关; （2) 对 Y , 不存在直接 
的因果作用。第一个前提条件保证工具变量与方程的扰动 
项不相关，第二个前提条件保证了模型可识别^如果这样的 
工具变董能够被找到，那么两阶段最小二乘法或最大似然法 
都可以用来获得方程 5. 3的参数的一致估计 a 

例如，影响1987年和1989年的合法抗议倾向和群体资 
格的被遗漏变量就有可能导致前面章节所讨论模型的扰动 
项自相关 # 用来预测1989年的抗议行为和群体资格的稳定 
得分方程只有在两个滞后因变量一1987年的合法抗议倾 
向和群体资格——存在一个或一组工具变量时，才能被估计 
出来。如果可以假定1987年的非法抗议倾向（石）影响了 
1987年的合法抗议倾向，但在控制其他变量的情况下，对 
1989年的合法抗议倾向没有直接的因果作用，且与1989年 
的合法抗议倾向的结构扰动项不相关，那么它就可以充当 
1987年合法抗议倾向的工具 变量。 TSLS 估计的程序与前 
面章节中的一 样:用 X - i 对其工具变量和所有其他外生变量 
进行回归得到，然后用兄对 f h 和在 I 预测方程中出 
现的所有其他变量进行回归。 

如果交互效应模型中存在由被遗漏变量 Z 引起的扰动 
项自相关，也就是说，方程 5. 3中的 Y 也会影响 X ，情况就会 
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变得更复杂。在这种情况下，X和 Yh 都必然与相关，模 
型需要再纳人一个工具变量 （Ha_ & Young, 1977)。在 

当前的例子中，如果我们假定时点1时，鼓励非法抗议的群 
体的资格 (z 2 ) 与时点 2 的结构扰动不相关，那它就可以被当 
做交互效应模型中的 GROUPS 的工具变量。 

在 LISREL 框架中，这类模型的估计是前面估计过的模 

型的直接拓展。结构扰动项之间的有关协方差在 Y 矩阵中 
设定,如果 PROTEST! , PROTEST,. GROUPSt 、 GROUPS 

是内生变量 1 到内生变量4,就可以让参数如和如处于自 
由状态以允许自相关的可能性。工具变量被作为外生 s 变 
量，它们的效应在含有外生变量和内生变量之间的结构效应 
的 r 矩阵中设定。在该矩阵中，为了保证模型的识别,必须对 
某些 y 效应加以限定。例如，将1987年的非法抗议倾向对 
1989年的 PROTESTS 的作用限定为0, 1987年鼓励非法抗议 
的群体的资格对1989年 GROUP 各的作用也设定为 0 fl 其余 
效应和矩阵的设定与前面章节中的设定完全一样，具体设定 
取决于被假定掌控整个因果系统的准确结构和测量过程。 
假定测量模型为前一章针对 PROTEST, 和 PROTEST, 

的三指标测量模型，结构模型为在那里没有设置的“反馈模 
型”以揭示 GROUPS 和 PROTEST 之间历时性的结构效应, 
这一自相关模型是用 LISREL 最大似然法估计的，下面是模 
型的结构 部分： 

PROTEST^ = 0. 32 PROTEST^ +1‘ 17 GROUPS 

[5,5] 

(0. 09) (0. 15) 

0, 29 0,46 
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GROUPS ^ 0. 95 GROUPS , + (—0. ODPROTEST , 

(0.16) (0.05) 

0. 86 - Q , 03 

PROTEST , 和 PROTEST 2 扰动项的协方差估计结果在统计 
上不显著，取值为 0.25, 标准值是0, 05。而 GROUPS 和 
GROUPS 两者的误差项的协方差估计值为 _0. 25,标准化 
取值是一0.34。这一结构扰动项之间的协方差估计在统计 
上显著。将本模型中的抗议倾向与群体资格之间的交互效 
应估计与方程 4. 14中的非自相关模型进行对比，就可以看 
到，此处两个变量间的关系完全是单向的， GROUPS 影响 
PROTEST 。 两个模型中的 PROTEST 的稳定效应，尤其是 
GROUPS 的稳定效应差异很大，这是不同时点的 GROUPS 
变量的扰动项之间的协方差为较大负值的直接结果。 

无论是通过两阶段最小二乘方法还是 LISREI ^ 方法来 

估计自相关扰动项的面板模型,都会出现这种类型的负向自 
相关 ( Long ，1983 bs 78； Markus , 1979:53)。尽管负向自相 

关存在具有实质性的解释的情况，但更可能意味着模型设定 
出错。一个很大的可能性是变量（在这里是 GROUPS 和 
GROUPS ) 测量无误差的假定是错误的。测量误差的存在 
和自相关，即自变量与其方程的误差项之间的相关 ，一 样会 
给 OLS 估计带来相同的问题。由于测量误差的解决办法之 
一 也是在分析中纳人工具变量，所以当这一偏差得到控制 
时，结构效应也常常会像在测量模型中的一样，不会变 
小。 [16] 因此，当负向自相关结果出现时，对模型的解释需要 
非常谨慎，并应该提出其他可以修正測量误差或设定错误的 
新模型。 
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在只有二期观察时，工具变量法是控制自相关的扰动项 
的唯一可行办法，但有关工具变量的外生性和其对系统中其 
他变量的作用的潜在假定常常是站不住脚的。在当前的例 
子中，我们假定1987年的非法抗议倾向与1987年的合法抗 
议相关，但是对1989年的合法抗议没有影响，并且与1989年 
的合法抗议倾向的误差项中所有被遗漏的变量 Z 都不相关， 
这一假定本身就可能是不合 理的。 而且，用工具变量替代滞 
后的内生变量通常会使所有因果作用的第二阶段估计变得 
很不准确。这些问题表明，工具变量方法作为控制因果系统 
中被遗漏变量的混淆效应的手段，在很多情况下是不太令人 
满意的。如果有三期或多期数据，下面介绍的方法通常更加 
适合《 

对不可测量变量的稳定性作出各种假设 

对带有自相关扰动项的因果作用进行估计的另一神方 
法是基于对方程 5. 4的误差项中被遗漏变量的稳定性的不 
同假设。在短期跟踪研究中，有理由假定 Z 代表一些个体的 
或具体单位的特征，或者一些不随时间而改变的特性，也就 
是说，= Z , = 因而方程 5. 4的误差结构 变为： 

u , = Z + t t [5.6] 

这里，$是随机扰动项。在该假定之下，无论针对哪个间隔， 
方程 5. 3的误差项《,之间的相关都是定值，也就是说，时点1 
和时点2的误差项; t 间的相关与时点1和时点3、时点2和 
时点3、时点1和时点4等误差项之间的相关完全相同。在 
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长期跟踪调査中，被遗漏变量更可能表现出不那么完美的历 
时稳定性，此时，误差项的结构将遵照时间序列研究中常见 
的一阶自回归模式： 

«, — pu t -i + tt [5. 7] 

其中， P 为取值小于1的自相关参数，$和之前的定义一样. 
在这一误差结构下，误差项之间的相关会以几何级数衰减， 
如果相邻扰动项之间的栢关为 p ， 那么相距两个间隔的扰动 

项之间的相关是 P % 如此类推^ 

Tuma 和 Hannana 984) 以及 Stimson (1985) 简单介绍了 

在混合横截面数据和时间序列分析框架下，估计此类含有自 
相关误差结构的面板模型的方法。在三期或多期调査数据 
下，如果模型的因果结构不随时间而变化，并且相邻两次观 
察间的时间间隔相等，混合数据法将是合适的分析方法在 
此处讨论的自相关模型中，这些方法的主要缺陷在于，和之 
前提到的一样,一旦两个变置被假定在一个交互因果模型中 
相互影响，就需要以工具变量的形式纳人更多信息。 

尽管文献中的范例很少，但非混合的多期面板自相关模 
型也能在 LISREL 框架中进行估计 & 这种模型的估计与二期 
数据情况下一样，首先让结构扰动项的¥矩阵的非对角元素 
自由取值，然后根据对扰动项结构的假定，给单个少元素施加 
限制 t 在标准化的三期模型中，内生变量 Y 有三个扰动项相 
关需要设为自由形式 : 如，代表第一轮、第二轮调査中 Y 的扰 
动项的相关 i 知，代表第二轮、第三轮扰动项之间的相关； 
如，代表第一轮、第三轮扰动项的相关.类似的代表 X 变量 
不同时间的误差项之间的相关参数也需要被放开。最后，带 
有恒定遗漏变量的模型可以通过使内生变量的扰动项之间 
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的各个相关系数彼此相等的方式得到估计 [17] ，也就 是说： 

如 = 如 = 如 [5* 8] 

表 5. 1展示了结构扰动项之间存在和不存在相关的两个 
模型的参数估计，使用的是上一章分析过的1980年的政党认 


表 5.1 带有和不带自相关扰动项的三期模鹽 



模型⑴ 

模型 (2) 

稳定性 

政党认同 

L0 

0 , 99 


(0. 02) 

(0.03) 

民意评分 

0 , 80 

0.71 


<0. 05) 

(0. 07) 

交叉一灘后作用 

政党认闻一民意评分 

0. 13 

0*20 


(0, 03) 

(0, 04) 

民意评分一政党认同 

—0,02 

0 , 01 


(0, 02) 

(0-01) 

自相关的扰动项 

政党认同 

一 0. 13 

一 0. 003 


(0*01) 

(0. 03) 

民意评分 

—0* 09 

0.05 


(0* 03) 

(0.04) 

同步的扰动項相关 

政党认 同一民 意评分 

0,04 

0.03 


(0.01) 

(0.01) 

瀏置囊差方差 

政党认同 


0.13 

信度估计值 


(0, 03) 

0.87 

民意评分 


0.20 

信度估计值 


(0, 04) 

0.80 

X ^ Cdf ) 

71.3(7) 

9.8(5) 


p < 0. 001 

p = 0, 08 


注:表中数字为标准他的最大似然估计值。括号中为标准误。所有模型的 
N 都是733 e 

资料来源 :全 国选举研究，主面扳文件，1980年^ 
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同和候选人评价之间关系的例子。和往常一样，假定因果作 
用为交叉滞后设定，且限定第一轮到第二轮间 P 1 D 对 
THERM 的交叉滞后作用和第二轮到第三轮间的相等。 
THERM 对 PID 的作用以及 PID 和 THERM 的历时稳定性 
也都做了类似限定，对 PID 和 THERM 的误差相关做了如方 
程 5. 8那样的限定以模拟稳定的遗漏变量产生的自相关扰 
动项 

初始模型 (1) 设置了自相关扰动项，但是没有考虑任意 
变量的各个时点的測量误差。结果显示政党认同和民意评 
分估计的稳定性非常髙，交叉滞后作用只在一个方向上—— 
从 PARTY 到 THERM ——统计显著。不过，和在两轮模型 
中一样，自相关估计值为负且在统计上显著，表明模型可能 
存在设定错误。考虑到上一章的结果模式，模型 （1) 无测量 
误差的假定很可能是错误的。模型 (2) 重新估计了该模型， 
但设置了第4章的三期单指标测量误差结构,并同时纳人自 
相关的扰动项。结果显示，两个自相关参数都很小,且在统 
计上不显著，而稳定性和交叉滞后作用都与第4章发现的结 
果近似。此外，模型整体对数据的拟合要比无测量误差模型 
(1) 好得多。我们对1980年大选期间，政党认同和候选人民 
意评分之间的关系为单向因果作用的信心更强了，因为在对 
因果系统中的自相关和测量误差假定不同的几个模型中，这 
两个变量间的作用模式一直保持相似。另外，在这个例子 
里，测量误差对因果作用估计的影响似乎比自相关的混淆效 
应大， 尽管如此，自相关给因果推论带来的潜在错误仍然很 
严重，只要有可能，研究者就应当尽量使用不同的模型设定 
来验证确保因果结论的模式。 
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如果误差结构被假定服从方程 5. 7 的一阶自回归模式， 
那么 LISREL 估计可以在标准化模型中运行。估计时，放开 
扰动项相关，并将相邻扰动项的协方差设定为彼此相等*然 
后令时点1和时点3的扰动项协方差等于时点1、时点2的 
扰动项协方差与时点2、时点3扰动项协方差的乘积在 
LISREL 中对模型参数进行此类限定的方法，请参见 Hayduk 
的著作 ( Hayduk , 1987) 0 最后，还可以设置 LISREL 模型以 
对扰动项的协方差进行没有限定的估计，只要用来识别这些 
参数的信息足够。不过，在交互效应模型中，对这些相关进 
行无限定的估计通常是不可能的，而且这种特别的模型设定 
无法反映任何已知的误差项结构 

对不可测量变量明确建換 

在 LISREL 或其他结构模型框架下估计带遗漏变量的 
模型的最后一种方法是明确设定一个额外的、没有测量指标 
的潜在变童，以代表因果模型中的不可测量变量 Z 。 为了使 
同时含有 X 和 y 之间的结构效应以及来自“虚幻”变量 Z 的 
效应的模型得到估计，至少需要三轮观察‘。这种方法的主要 
优点在于，它允许直接设定因果系统中测量变量和不可测量 
变量间假定的相互作用，并且只要有足够的自由度用以识别 
参数，它就能提供所有因果作用的大小和方向的最精细的估 
计。图 5. 2展示了这类不可测量变童模型中的一种可能形 
式，其中遗漏变量^(在 LISREL 中作为没有测量指标的新增 
ij 来建模)一直同时影响 X 和 Y ， 而 X 和 Y 之间也有交叉滞 
后作用 a 
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面 5 . 2 含有不可测 量变置 2 的三期交又滞后樵型 
表 5 . 2自攝违法行为和违法网伴涉入度的 H 期不可 测量变 最模型 


结构效应 


SRD 到 SRD 

0,40 

IDP 到 IDP 

0.14 

IDP 到 SRD 

—0.04* 

SRD 到 IDP 

0.01* 

Z 到 SRD 

0* 45 

Z 到 IDP 

0, 58 

时间I时的相关系数 


r(SRD，IDP) 

0, 54 

r(SRD, Z) 

0.61 

KIDP* Z) 

0.63 

r(IDP t SRD 扰动项） 

a 13 

X^(df) 

90, 8(7) 

/>值 

<0* 001 


注 : JV = 1725。所有变量都已被标_化，表中所示的数宇为最大似然估计 & 
不带星号的系 数都在 0. 05水平上显著„ 

资料来源:全国青少年调查 (1976 —1978 年）。 

为了识别模型，必须限定结构效应在不同时期相等， 

和 I 方程以及兄和方程的误差方差也需分别设定彼此 
相等。不可观测变量 Z 的方差被设为1。与迄今估计过的其 
他交叉滞后模型一样，模型中纳入了时点2各变量扰动项之 
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间的同步共变以及时点 3 各变量扰动项之间的同步共变，以 
便把握那些可能在同一轮而非下一轮调査中，对 X 和 Y 都造 
成影响的被遗漏因素。在此设定之下，模型拥有七个自由 
度，已经过度识别。随着观测期次的增加，需要限定的参数 
减少。同样值得注意的是，通过纳人那些与叉和 Y 相互影响 
的外部观察变量，这个模型扩展起来非常容易。在实际操作 
中，这些变量将被当做图 5. 2的全部六个变量的外生作用来 
处理，使模型成为那些由测量和不可测量的外部变量造成的 
潜在虚假性的代表。为了便于说明，在此处不考虑这些变 
量。我们用前面分析过的青少年自报违法行为 （ SRD )_ 违 
法同伴涉入度 ( IDP ) 的关系,对这一模型进行了估计，其结果 
展示在表 5. 2中。 

该模型对数据的整体拟合度很差，在七个自由度下的 x 2 
值是 90. 8 ( p < 0 . 001)。但是回想一下第3章中含有 SRD 和 
IDP 同步交互效应和交叉滞后作用的模型，在八个自由度下的 

X 3 值是 167. 0,这表明，比起只含直接因果作用的模型，不可 
测量变量模型对数据的拟合度更好 0 有趣的是，模型显示， 
一旦控制了不可测量变量的影响， SRD 和 IDP 之间的交叉滞 
后作用在任意方向上都不再显著。重新估计一个带有 IDP 
对 SRD 的同步作用以及 SRD 对 IDP 的滞后作用的不可测量 

模型，得到的 X 2 值是 101. 8,自由度是8,与上面的交叉滞后 
模型的拟合度几乎相同。在这一“反馈”模型中， n ) P 对 SRD 
的标准化作用显著，取值为0.31，但 SRD 对 1 DP 的标准化影 
响只有 a 10,比第3章所估计模型的值小。这两个模型在三 
期数据下无法直接比较，因为同时含有不可测量变量以及 x 
和 Y 之间的同步因果作用和同步扰动相关的模型是不可识 
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别的。 

不管怎样，这些结论让我们难以继续认为两个变量间的 
交互作用的大小相似。数据与关系至少是压倒性的单向关 
系，或者说与其完全虚假这一解释相吻合。在此情况下，由 
于模型拟合度差，所以还应当估计并比较那些允许观察变量 
存在测量误差的其他可能设定。如果能通过新增观测轮次 
的方式提供更多信息，利用含有多个不可测量变量并允许不 
可测量变量存在历时变化的模型，我们就可以设定出能对这 
些解释进行更准确的相互检验的模型。 

本章简要介绍了一些由公因子和不可测量变量造成的 
虚假相关模型和自相关模型。如果控制了所有这些可能的 
虚假性来源后，变量之间仍然存在显著的因果作用，那么研 
究者将会对结论的效度有更大的把握。不过应当强调，被观 
测变量造成的虚假相关也是跟踪调査设计中非常重要的问 
题，在得出因果结论之前，可以而且应该用数据对这些效应 
进行检验。显然，所有在理论上与 X 和 Y 有关的被观测变量 
都应被纳人模型。另外,我们可以估计那些剔除了所关注变 
量间的所有直接因果作用的模型，并从拟合度和实际合理性 
方面将其与因果作用模型加以比较。 X 和 Y 之间的共变可 
能是由被观测的第三个变量或者由扰动项之间的同步共变 
产生，而不是由直接的因果作用产生。因为因果作用模型嵌 
套在没有因果作用的模型之中，它们的相对拟合度可以在 

LISREL 或相关程序中通过 X 2 差异得到估计。 

所有这些模型都应被当做检验虚假相关的补充工具。 
应当强调的是，估计含有公因子和不可测量变量的模型不能 
完全替代研究者可获得的其他更确定的手段，即直接纳人那 




U 4 I 用面做搪做 因果 分析 

些被认为与给定因果系统有关的变量 9 不过，至少此处的模 
型试图将不可测量变量的作用明确地整合到模型设计中，而 
不是简单地假定(横截面数据中所做的就是这样)所有相关 
变量都已被纳人。此外， LISREL 方法在模型检验上具有很 
大的弹性,允许模型的相互检验以确定虚假相关可能出现的 
具体形式。在很多情况下，虚假相关可以通过这些检验被排 
除。如果没有被排除，来自直接因果作用模型的估计应该被 
谨慎对待，并在公因子或不可测量变量模型对数据的拟合同 
等有效这一事实基础上加以解释。 



























































































本书回頋了多种通过面板数据分析增强因果推论过程 
的方法。面板数据可以用来估计含有各种时滞设定、交互因 
果关系以及测量误差的模型，那些试图控制变量间潜在虚假 
相关的模型也可以得到估计。我们在整本书中已经表明，三 
期或更多轮次的面板数据可以使这些模型的估计和比较更 
方便，但在克服常见的成功因果推论的障碍上，相对截面数 
据，即便是二期面板数据也具有显著优势。 

尽管比起截面和其他观测研究设计，面板数据分析有许 
多优点，但本书始终强调，面板数据不可能完全解决经验研 
究中因果推论方面的所有困难。此处开发的所有模型和方 
法都依赖于它们各自的假定，它们在特定情况下可能站不住 
脚或者会导致错误的经验结论 9 研究者应当时刻保持清醒， 
因为不同的估计模型可能都能拟合给定的数据，因而在特定 
研究背景中，没有哪个模型是唯一可接 受的。 正如 Dwyer 
(1983:322) 提 到的: 

从被动的纵向教据中进行因果推论的智慧仅仅开 
始于人们意识到，一个被接受的模型与其他被同一套数 
据拒绝的多数模型同样有效。 


第 e 章关于在面板分析中进行因果推论的雉语 


另外，因果推论的过程并不只是设定并检验你想要证明的作 
用这么简单，在此过程中，研究者需要努力拒绝各种看似正 
确的模型，包括那些不含因果作用的模型和对直接因果假设 
进行检验的模型。这是一项极具挑战性的工作，对此，面板 
分析为非试验研究提供了当前可获得的、尽管不完美但却最 
有希望的工具。 


































































































































120 


用面植 數 据鸞因果分析 


附录 | USREL 矩阵及符号系统 


在 LISREL 结构模型中，内生变量用希腊字母 7) 指代，外 
生变量是5,结构扰动项是I将各个内生变量连接起来的 
结构效应被标记为卩系数，将外生变量(或先定变置 )$ 与内 
生变量连起来的结构效应用7系数 标记。 例如，一个只含一 
个历时性地自我影晌的变量的简单三期模型可以写成/ 


邛= Tii^i +& 

作 = 由1 ，+匕 


[A1] 


其中，色对应该变量第一轮调査的取值， i|i 和％分别为第二 
轮和第三轮的变量值 a 用矩阵形式表示，该系统如下所示： 


叩 o o tji y u 

= + & + 

4 J L^i 0J [rp) { 0 J [t^ J 

LISREL 结构方程系统的多方程矩阵一般形式是; 


f| = Bii + r| + ? [A2] 

这里， f| 是 m 个内生变量的向量是 n 个外生变董的向量， B 
是连接内生变量的 P 系数 ( mXm ) 矩阵， r 是一个 （mXn) 的 
连接外生变量和内生变量的 Y 系数矩阵,？是一个 （mXl) 的 
结构扰动项向量，其他与估计目的相关的矩阵还有 （nXn) 
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的外生变量方差协方差矩阵 O 以及 （m X m ) 的结构扰动项 
的方差协方差矩阵平。 

当变量含有随机测量误差时，使用矩阵形式同时表示一 
个模型的测量方程和结构方程可使这个程序得到扩展《如 
果1是内生变量的真实得分 , X , 是真实得分对观测指标 Y 的 
回归系数，测量模型的多方程矩阵将 会是： 

y = Aj , i|+s [ A 3] 

上面的 y 是内生变量所有9个指标的 (9 X 1) 向量, A y 是将 m 
个内生变量与对应指标连接起来的 X y ( qXm ) 矩阵，6是指标 
测量误差的 GX 1) 向量。测量误差的方差协方差被汇拢在 
( gXq ) 的矩 阵呔中 ，其单个元素是汰。 

当模型含有外生变量时，它们的每个指标可以被写成同 
样的一套测量方程。方程 A 3 的对应方 程为： 

x = A x 4 + 8 [ A 4] 

其中， x 是外生变量$的 P 个指标的 (P X 1 ) 向量, Ai 是一个 
CpXn ) 的连接 n 个外生变量与对应指标的； W 矩阵,8是一个 
(夕 XI )的指标测童误差向量。外生变量指标的测量误差的 
方差协方差都在 （P X p ) 的矩阵私中，其单个元素为 0 e 。 
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注释 


[ I ]面板数据的这些特点在其他形式的纵向数据中也能找到，合并的时间 
序列数据”将多个单位的时间序列数据合并成单个的数据集 （ Sayrs ， 
1989) 0 尽管这两类数据没有形式上的区别，但合并的时间序列数据通 
常被认为含有更多时点，而面板数据含有更多的案例 ，它 往往只包含大 
量案例的第二到第五轮数据。这种区别使对两种数据的分析策略也不 
尽相同 （Kessler & Greenberg , JL 981* 第 11 章 ， Turna & Hannan ， 
1984.第2章 ) a 

[ 2 ] 见 Allison (1990) 以及 Judd 和 K e rniy (1981) 关于在何种条件下，无条件 

的变化得分模型适合分析实验和准实验数据的讨论 . 

[. 3 J Hargerxs、Raslan 和 AUkjcm (1976 s 454— 455) 在一项关 T 科研产出的分 

析中认为，一个没有时滞 y 变量的模型“似乎特别适用于那些在每个时 
间间隔上都必须重新创造或生产的 • 变量，而不是那些具有内在稳 
定匣原则的变量。换言之，除非对其采取行动，否则这些变量会倾向于 
保持不变的变量' 

[4] 其他含有滞后 Y 变量作为自变量的理论模型还包括适应性预期模型和 
Koyek 分布式滞后模型.在适应性预期模型中，因变量的真实值由自 
变量的未知 u 期望”值而非真实值决定，模型设定该期望值由上一时期 
的期望值的修正产生，修正量为最后一个时期的期望值与真实值之差 
的一个固定比例。而在 Koyck 模型中， Y 的当前值由 X 的当前值与所 
有过往值决定，这些模型通过代数运箄，能产生一般形式与部分调整 
模型相同的估计方程，只是误差顼结构不同，并引发了统计估计上的不 
同问題 & 关于这些模型及相关估计方法的具体介绍，见 Gu 】 arau (1988) 
的著作. 

[ 5] 正如 iPlewuUgSSjO ) 所说: “( X f 和 Y ,) 之间的因果关联……与其说意 
味着同步作用，不如说意味着这样一种可能性，即 X 在时点1之后某 
个时间发生的变化将导致时点2时 Y 的变化，而所谓的‘某个时间>没 
有任何精确的 界定， 

[S ] 由于兄、、 AX 中的每一个变量都是另外两个的线拄组合_因而无 
法将三个变量同时纳入同一个回归模型以估计它们的独特效应 。 
Kessler 和 Greenberg (1981: 第6章)建谈了一些估计全部效应的方法》 

但需要对三者的效应大小或它们的相互关系进行一些严格的假定，或 
者对该因果系统引人更多的信息 Q 

[7] 这两个估计的一致陛可被当做模型的整体检验之一。 T _ 和 Hanan 
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(1984:344) 指出，如果两个估计分歧很大,这表明不是初始微分方程的 
函数形式设定错误,就是外生变量 X 的历时变化方式设定错误 

[8] SPSS 和其他计算机软件包中的 TSLS 程序提供了每个方程的结构扰 
动项估计，之间的标准化协方差就是这些估计之间的相关系 
数，如果是通过 L 1 SREL 的最大似然程序估计同步作用模型，那么模 
型带有的一个自由度允许对模型的假定进行正式的统计检验。如果 

X 2 值大于 3. 84( 即自由度为1时, 0* 05显著性水平上的临界值），那么 
有关扰动项之间的共变为0的假定在总体中是不成立的，但是•不对 
这些参数进行约束，又会导致模型不可识别，除非纳人新的外生变量。 

[9] Gill ^ pk 和 Fox 的讨论严格限定在他们所谓的“平行”联立方程模型 
内，后者代表不同单位的相同变量之间的相互作用，例如某个青年的职 
业期望与其好朋友的职业期望是交互相关的 & 特别是在这些情况下, 
结构扰动项之间的负向共变在理论上是非常不可能的，但 w 内生变量和 
外生变量测量中的随机误差造成的后果和遗漏一系列外生变量的交 
叉一濯后作用的后果 …… (看起来)都适用于非递归模型 ” (Gillespie & 
Fox , 1980;304)。 

[10] 通过一致性限定得到估计的三期模型的一个相关问埋在于，这一模型 
要求因果系统在整个面板期间尚未处于平衡状态，如果情况确实如 
此，那么更多期次的观察并不会提供更多有关变量协方差的新信息，因 
为第二轮至第三轮之间的协方差将等于第一轮、第二轮之间的取值。 
因而模型无法从经验上得到识别。 Kessler 和 GreebergC 1981 s 37—46) 

表明，只有当系统远未达到平衡时，一致性限制这种方法才能产生精确 
的参数估计， 

[11] 在标准化了的測量模型中％的方差被固定为1,所以 iW 为一个自由参 
数。如果观察指标同样被标准化，那么 k 代表潜变量与观察指标之间 
的棚关，这有时被称为“认知性相关”或 “效度系数 ” (Sullivan &■ Feld ¬ 
man t 1979)。 

[12] 如果随机误差出现在因变量中，对于自变量效应的 OLS 估计将会无偏 
但缺乏效率，因为方程的结构扰动项估 ft 値将会被夸大.见 Beny 和 
Feld _(1985 :27— 28) 的著作， 

[13] 如果: v , = X ,且所有变量都被标准化，那么，把这一方程平方，然 
后求其期望值 ，将得 到1 = M +頊 • 所以误差项的方差等于1 一 Xi 。 

[14] 不过, Werts 等人 ( 1971 ) 指出，如果在 Wiley - Wiley 模型中不作 出误差 

方差相等的假设，那么“中间”指标 A 的误差方差可识别.其信度可以 
这样计算得到 ： = mm / ru , 但如果没有更多的限定，其他参数都 
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将无法识别。 

[15] 表中所示为潜变量和观察指标的方差都被标准化为1的“完全标准化 
解' LISREL 也能产生一种仅仅只有潜变童的方差被标准化为1的 
标准化解„如果使用的是后一种结果，那么每个指标的信度应该这样 
计算 f XV [ A £ + Var ( e )] 0 

[16] 在三期或多期模型中，其他可能的设定错误还包括，逋漏从第一轮调査 
的滞后内生变量到第三轮的内生变量的因果参数 >遗漏从 El 到 ◎ 的二 
阶自相关效应，还有其他对误差项结构的错误设定。所有这些模式还 
会使滞后的内生变量的稳定效应往髙的方向偏，这在未设定这些效应 
的模型中,体现为负向自相关。如果模型中有足够的自由度，那么这些 
效应都可以被纳人 LISREL 并进行检验。 

[17] 这种类型的三期模型可能存在一些偏差，因为时间1的扰动项含有时 
间 1变量的所有变异，而时间2和时间3的扰动项仅含有残余的变异 g 
如果有四轮或更多轮次的调査数据，扰动项的协方差或相关相等的假 
定可以撒定在时间2、时间3、时间4等的扰动项之间。 
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